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OM nucleic - nucleic search, using sw model 

Run on: March 5, 2005, 15:38:47 ; Search time 8472.11 Seconds 

(without alignments) 
12117.322 Million cell updates/sec 

Title: US-10-624-932-l_COPY_46_2742 
Perfect score: 2697 

Sequence: 1 atggccgtccggcccggcct tgtcggaggctgagtgctga 2697 



Scoring table: IDENTITY_NUC 

Gapop 10.0 , Gapext 1.0 



Searched: 34239544 seqs, 19032134700 residues 

Total number of hits satisfying chosen parameters: 68479088 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 



Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 
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Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 



SUMMARIES 

% 

Result Query 

No. Score Match Length DB ID Description 



1 


960.2 


35. 


6 


2802 


9 


AY406491 


AY406491 


Homo sapi 


2 


950.4 


35. 


2 


2791 


9 


AY406493 


AY406493 


Mus muscu 


3 


923.4 


34. 


2 


3790 


3 


AK031655 


AK031655 


Mus muscu 


4 


874 


32. 


4 


1852 


3 


CR598115 


CR598115 


full-leng 


5 


871.4 


32. 


3 


3866 


3 


AK018177 


AK018177 


Mus muscu 


6 


814 


30. 


2 


2802 


9 


AY406492 


AY406492 


Pan trogl 


7 


810.4 


30. 


0 


2532 


9 


AY411747 


AY411747 


Homo sapi 


8 


780.4 


28. 


9 


2532 


9 


AY411749 


AY411749 


Mus muscu 



Q 

-7 


768 . 6 


28 . 


5 


1034 

X \J J *± 


4 


BT758231 

OX / JUL Jl 


BT758231 

OX ( JUL Jl 


603029876 

UU JUL J U / \J 


i o 

X U 


796 6 


97 


9 


1 S99 


9 


RP 09 37 97 

DV_» UJJ / C. 1 


RP033797 


nuuiu oapi 


1 1 
X X 


79S 9 

/ J J • £• 


97 


9 
o 




i 

X 


ATQS1 SS6 

f\J- J Jl J JO 


AT951 556 

^i-X J J X J J vJ 


wv36f"04 x 


~ 1 o 


791 6 


96 


ft 

o 


7Q6 




RV 9 4 ft 1 Q 9 

DA J 1 O X -7 J 


Ry 9 4 ft 1 Q 3 

.DA JtUI JJ 


Ry94 8193 

DA J " UU J 


1 X 


719 4 


96 


j 


ftl ft 

O X o 




RT ftl ft 60Q 


RTft 1 ft60Q 


60903336? 

UU JU J J JUL 


1 4 


67ft 9 


9S 


1 

X 


9S39 

c* J J C 


Q 
-/ 


AY4 1174ft 

T\L 1 X X / *± O 


AY4 1 1 74 ft 


p ri ri +■ TTirrl 
irdii Liuy x 


1 ^ 


679 6 


94 


q 


Q94 


9 
z 


RP91 1 ft04 
or j x x o u ft 


RR91 1 ft04 

DC JllOUl 


601 ft 9731 6 




66S 

O \J J 


94 


7 
i 


ft SQ 

O <J -7 


9 


RP91 1 ftQ6 


RF31 1 ft Q6 

DC JXXO-7VJ 


601 ft 97733 

OUIO J ( /JJ 


1 7 

X / 


647 4 


94 


n 
u 


ft S9 

O O «J 




Ry 9 6 4 S 7 4 

DA J \J *1 J / 1 


Ry 364 S74 

DA J Ol J / t 


Ry 364 574 


1 ft 
X o 


691 

OZ X 


9 9 
z j . 


n 
u 


U U 




RY 9 4 S 4 0 6 
DA J fl J ft U O 


Ry 94 54 06 

DA J ft J ft U O 


Ry 94 54 06 

DA JH J1UO 


1 Q 
X y 


61ft ft 

D X O • 0 


99 
zz • 


Q 


7 S6 

/JO 




RTT61 99ft7 
DU OiZ JO / 


RTT61 9 9R7 

DU DXZ J O / 


TTT _M— FW0 — 


90 
Z u 


61 n 9 

D1U.Z 


99 
z z • 


D 


977 R 
Z / / D 


Q 


av4m 4 71 

I\l ft U X ft / X 


a y4 01471 
r\JL ft U X ft /X 


1 V 1U 5 UlU. t> o u 


9 1 
Z X 


609 9 
DUO . Z 


99 
z z . 


A 
ft 


ft74 


c. 


RH6ft Q1 4 ft 

DyOO j X ft O 


RD6ft Q1 4 ft 
Dyoo zf x fi o 


Af^FMPOTTRT 
rWjsliVi \*\J U rs. 1 


9 9 
ZZ 


600 6 

DUU • D 


9 9 
ZZ • 


o 

j 


ft ft Q 

o o y 


CI 

D 


D^oy x y xd 


RD6Q1 Q1 R 

oy oy x y x d 


AoI-iIn U rs. 1 


9 9 
Z o 


6O0 9 


9 9 
ZZ • 


o 

j 


Q7 7 

y / / 


D 


R V 94^407 
DA j ft Oft U / 


Ry 9 4 54 07 
DA j ft D ft U / 


Ry 9 4 5 4 0 7 
DA J ft J ft U / 


9 4 
Z ft 


Dy y 


99 
ZZ • 


Z 


977 ^ 
Z / / D 


Q 

y 


a v4 fl 1 4 6Q 

/\i fiuxft oy 


AV4 01 4 6Q 
r\I ft U X ft D _/ 


nouio bdpi 


9 ^ 
Z D 




9 9 
ZZ . 


X 


OU1 


T 
X 


at ^;c:ftn 

• ALDlDDoU 


AT R 1 ^RftO 
niiJlOJO U 


at ci ccpn 
J\LjD X OD 0 u 


96 

Z O 


S ft Q 4 
J O j ■ 4 


91 
Z X ■ 


Q 


604 
D U ft 


9 

z 


ot?91 A 970 

DJj J X ft J / U 


RF91 4 97 0 

DD J X *± J / U 


601 1 4 79 61 

O U X X 1 /LUX 


Z / 


^ft 6 6 
Dot). D 


9 1 
Z X . 


O 

o 


1 H79 
1 U / Z 


D 


nv 4 9 9 9 R 9 
OA ft Z Z / D j 


Ry 4 9 9 7^9 
DA ft Z Z / J j 


Ry 4 9 9 7 5 9 
DA ft Z Z / j j 


9 ft 
Z 0 


^66 6 

ODD. D 


9 1 
Z X . 


u 


67 ft 


D 


r*a74 Q7 ft 4 
/ ft y / o ft 


PA74 Q7ft4 
^.M. / ft y / o ft 


U X 1*1 r JJ U 


9 Q 
Z y 


^61 
Jul 


9 n 

z u . 


p 


X X / D 


9 
Z 


RTTR9064 0 
or D j u Oft u 


RP590640 
or j JUOfiu 


609071 Q91 
OUZU / XjjX 


90 

J U 


JJJ . O 


9 n 

z u . 


D 


7 ft ft 

/oo 


D 


f*Z\91 7 R99 
j X / D j Z 


r A91 7 599 
J X / J J z 


TTT — M— PTIaT 0 — 
U X 1Y1 r Vw U 


9 1 
J 1 


ODD 


9 n 
z u . 


O 


^7 9 
D / Z 


1 


L»KDDft D oy 


^kj d ft d oy 


H'K'TJ 1 7r>4 ^ QT 

uj\r 6pft jji 


9 9 

jZ 


4 Q 1 9 

fi y x . z 


i ft 


9 
Z 


fi y y 


9 


l.k / 4 / j y O 


l^k / ft / oy o 


r"D7 4 7 9Q ft 

ok / ft / j y o 


JJ 


4 ft £ 9 
ft o 0 . Z 


1 ft 


n 
u 


/i a 

Dfl o 


D 


nv 4 c. 9 R 1 H 
DA 4 D Z D 1 U 


DA ft DZDXU 


Ry 4 S 9 51 0 
DAfl DZDXU 


9 /l 

ofl 


fi 1 X • Z 


1 / . 


D 


Dfl U 


ft 


Di4o / / yy 


di 4 0/ / y y 


9 ft Q5 fi 9 MZi 

j o y d o j nrt. 


9 

JJ 


4 / U . D 


i n 
If. 


D 


ZDU / 


Q 

y 


Al 4 U 14 / U 


A V4 O 1 4 9 O 
J\l 4 U 14 / U 


jra.n urogi 


J 0 


4 £ft £ 
ft oo • o 


1 9 

x / . 


ft 


ft 94 
oz fl 


ft 


dti o 9 no 4 
Dl * j / UZ 4 


DTI 99 09 4 
Dl / j / UZ ft 


609960ft74 
OU j j OU O / ft 


9 9 


y|QQ 9 


10 . 


o 
Z 


D / D 


D 


r* A 91 P. /l p 9 
LAj 1 D 4 O / 


r* n 9 1 R4 ft 9 
LAj 1 D 4 O / 


TTT — M— TTTaT O — 

U i — jyi — C W U 


9 P 

J O 


4 9 9 
fl JJ 


Id. 


*l 
X 


ft / J. 


D 


dv 9 P 9 n Q R 

daz oz u y d 


RV 9 ft 9 fl Q ^ 

daz oz uy d 


RV9 ft 9 0 Q 5 
DAZ oz u y D 


9 Q 

j y 


4 9 fl 4 
ftZ 0 . ft 


ID . 


Q 

y 


114 9 
lift / 


D 


"RTTft 4 O 4 4 £ 
OU O 4 U4 4 O 


RTTft4 0446 
DU O ft Ufl ft O 


D. r* TT \T r* OT T 13 T 


4 U 


4z4 


Id . 


/ 




4 


BGy 1 j44 U 


bC^y lo4 4U 


cnoQi 1 991 
oUzo 11 jz 1 


41 


417.8 


15. 


5 


856 


7 


CN164143 


CN164143 


994266 MA 


42 


411.8 


15. 


3 


749 


7 


CF735417 


CF735417 


UI-M-HBO- 


43 


410.6 


15. 


2 


1111 


4 


BG298307 


BG298307 


602397080 


44 


409.8 


15. 


2 


751 


7 


CF735550 


CF735550 


UI-M-HBO- 


45 


408.8 


15. 


2 


460 


2 


BF443156 


BF443156 


260542 MA 



ALIGNMENTS 



RESULT 1 
AY406491 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



AY406491 2802 bp DNA linear GSS 15-DEC-2003 

Homo sapiens UNC5C gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY406491 

AY406491 .1 GI : 39762465 
GSS. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteieostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 2802) 

Clark, A. G. , Glanowski, S . , Nielson,R., Thomas, P., Ke j ariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 



TITLE 

JOURNAL 
PUBMED 
REFERENCE 
AUTHORS 



TITLE 
JOURNAL 

COMMENT 

FEATURES 

source 



gene 



Ferriera, S. , Wang, G. , Zheng, X.H. , White, T. J. , Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 

Inferring nonneutral evolution from human- chimp -mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 

2 (bases 1 to 2802) 

Clark, A. G., Glanowski, S . , Nielson,R., Thomas, P., Kejariwal,A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D. R. , Lu,F., Murphy, B., 
Ferriera, S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 
Direct Submission 

Submitted ( 16-NOV-2003) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 

This sequence was made by sequencing genomic exons and ordering 
them based on alignment. 

Location/Qualifiers 

1. .2802 

/organism="Homo sapiens" 
/mol^ype^" genomic DNA" 
/db_xref="taxon: 9606" 
<1. .>2802 
/gene="UNC5C" 
/locus_tag="HCM2575" 



ORIGIN 



Query Match 35.6%; 
Best Local Similarity 61.3%; 
Matches 1682;. Conservative 



Score 960.2; DB 9; 
Pred. No. 1.9e-194; 
0; Mismatches 995; 



Length 2802; 
Indels 69; Gaps 



6; 



Qy 

Db 



12 GCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGG 7 1 

I I I I II I I I I I I II II I I I II I I III I 

66 GCTCGTGCTACCTGCCCTGGCCCTGCTCAGCGCCAGCGGCACTGGCTCCGCCGCCCAAGA 125 



Qy 

Db 



72 TGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCC 131 

II I I I I I I I I I I I I I I I I I I I I I 

126 T GAT GACTTTTTT CAT GAACT CCCAGAAACTTT T C CTT CT GAT C CACCT GAGCCT CT GC C 185 



Qy 

Db 



132 C CACTT CCT GGT GGAGCCC GAGGATGT GT ACAT CGT CAAGAACAAGC CAGT GCT GCTT GT 191 

I I I.I I I I I I I I I I II II I M II II I I I I I I I I I I III j I 
186 ACAT TT CCTT ATT GAGCCT GAAGAAGCT TAT AT T GT GAAGAATAAGC CT GT GAAC CT GT A 245 



Qy 192 GTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCA 251 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 246 CT GTAAAGCAAGCCCT GC CAC CCAGAT CT ATTT CAAGT GTAAT AGT GAAT GGGTT CAT CA 305 

Qy 252 GGT GGACCAC GT GAT C GAGC GCAGC ACAGACGGGAGCAGT GGGCT GC C CAC C AT GGAGGT 311 

I I I I I I II I III II I I I I I I I I I I I I I I I 

Db 306 GAAGGACCACATAGTAGATGAAAGAGTAGATGAAACTTCCGGTCTCATT GT CCGGGAAGT 365 

Qy 312 CCGC ATTAAT GT CT CAAGGCAGCAGGT C GAGAAGGT GTT C GGGCT GGAGGAAT ACT GGT G 371 

1 1 1 1 1 i in i 1 1 1 1 1 1 1 1 1 i i 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 ii 

Db 366 GAGCATT GAGATT T CGC GCC AGCAAGT GGAAGAACT CTT TGGACCT GAAGATT ACT GGT G 425 

Qy 372 C CAGTGC GT GGCAT GGAGCT C CT CGGGC ACCAC CAAGAGTC AGAAGGC CT ACAT C CGC AT 431 

II I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I II I I I I I I 

Db 426 C CAGT GTGTGGCCT GGAGCT CCGCGGGT AC CACAAAGAGCCGGAAGGCGT AT GTGCGC AT 485 



Qy 432 AGC CAGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCT 4 85 

II I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I 

Db 486 T GCATNNNNNNNNNNN CGGAAGACATTT GAGCAGGAAC C CCT AGGAAAGGAAGT GT CTTT 545 

Qy 486 GGAGCAGGGCAT C GT GCT GCC CT GC C GT C C AC C GGAGGGCAT CCCT C CAGC C GAGGT GGA 545 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 546 GGAACAGGAAGT CTT ACT C C AGT GT C GACCAC CT GAAGGGAT CCCAGT GGCT GAGGT GGA 605 

Qy 546 GTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATCACGCG 605 

I I I I I I I I I I I I I I I I I III I I I I I I I I II 

Db 606 AT GGTT GAAAAATGAAGACATAATT GAT CC C GTT GAAGATCGGAATTTTTAT AT T ACTAT 665 

Qy 606 GGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGT 665 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 666 TGATCACAACCT CATCATAAAGCAGGCCCGACT CT CTGATACTGCAAATTACACCTGTGT 725 

Qy 666 GGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAA 725 

I I I I I I I I I I I I I I I II I III I I I I I I I I I I I I I I I I 

Db 726 T GCCAAAAAC ATT GTT GCCAAGAGGAAAAGT ACAACTGCCACT GT CAT AGT CT AT GT CAA 785 

Qy 726 CGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTG 785 

I I I I I I I I I I I II I I I I I I I I I I I I I II II I I I I I I II I I II II I 
Db 786 CGGTGGCTGGTCCACCTGGACGGAGTGGTCTGTGTGTAACAGCCGCTGTGGACGAGGGTA 845 

Qy 786 GCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGA 845 

I II I I I I I I III II I I I I II I I I I I II I I I I I Mill II I I I I I I I I 
Db 846 T CAGAAACGT ACAAGGACTTGTACCAAC C C GGCAC CACT CAATGGGGGT GC CT T CT GT GA 905 

Qy 846 GGGGCAGAAT GT C CAGAAAACAGC CT GC GCCAC CCT GT GCC CAGT AGAC GGCAGCT GGAG 905 

I I I I II I I I I II I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I 
Db 906 AGGGCAGAGTGT GCAGAAAATAGCCTGTACTACGTTAT GCC CAGT GGATGGCAGGTGGAC 965 

Qy 906 CCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTG 965 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 966 GC CATGGAGCAAGT GGT CTACTT GTGGAACTGAGT GCACCCACT GGCGCAGGAGGGAGT G 1025 

Qy 966 CTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTGGACACCCG 1025 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1026 CACGGCGCCAGCCCCCAAGAATGGAGGCAAGGACTGCGACGGCCTCGTCTTGCAATCCAA 1085 

Qy 1026 CAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTA 1085 

I I I I I I I II II I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 1086 GAACTGCACT GAT GGGCTTT GCAT GCAGACT GCT C CTGATT CAGATGAT GTT GCT CT CT A 1145 

Qy 1086 TGTGGG CCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCT 1142 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1146 TGTTGGGATTGTGATAGCAGTGATCGTTTGCCTGGCGATCTCTGTAGTTGTGGCCTTGTT 1205 

Qy 1143 CGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCAC 1202 

I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1206 T GT GTAT CGGAAGAAT CAT C GT GACTT T GAGT CAGAT AT TAT TGACT CTT C GGCACT CAA 1265 

Qy 1203 CT CAGGCTT C CAGCC C GT CAGCAT CAAGCC CAGCAAAGC AGACAACC C C CAT CT GCT CAC 1262 

I I I I I I I I M I I I I I I I I I I MM I I I I II I I I I 

Db 1266 TGGGGGCTTTCAGCCTGTGAACATCAAG GCAGCAAGACAAGATCTGCTGGC 1316 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 



1263 CAT CCAGC C GGAC CT CAGCAC CAC C AC CAC C AC CTACCAGGGC AGT CT CT GT C C C C GGC A 1322 

II I I I I I I I I I I I I III III II I I I I I I I I II I 

1317 TGTACCCCCAGACCTCACGTCAGCTGCAGCCATGTACAGAGGACCTGTCTATGCCCTGCA 1376 

1323 GGATG GGCC CAGC C C CAAGTT C CAGCTCACCAAT GGGCACCTGCTCAGCCC 1373 

III II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1377 TGACGT CT C AGACAAAAT C C CAAT GAC CAACT CT C CAATT CT GGAT C CACT GC C CAAC CT 1436 

1374 CCTGGGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTT 1433 

I I I I I I I I II I III I I I I I I 

1437 GAAAAT CAAAGT GT ACAACAC CT CAGGT GCT GT CAC C CCC CAAGAT GACCT CT CT GAGT T 1496 

1434 CGTCTCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACAT 1493 

III I I I I I I I I I I I I II I II II I I 

1497 T AC GT CCAAGCT GT C C C CT C AGAT GAC C C AGT C GTT GTT GGAGAAT GAAGC C CT CAGC CT 1556 

1494 GA ■ CCTATGGGACCTTCAA 1511 

II I I I II I I I I I I I 

1557 GAAGAACCAGAGTCTAGCAAGGCAGACTGATCCATCCTGTACCGCATTTGGCAGCTTCAA 1616 

1512 CTT CCT CGGGGGC C GGCT GAT GAT CC CTAAT ACAGGT AT CAGCCT CCT C AT C C CC C C AGA 1571 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

1617 CTCGCTGGGAGGTCACCTTATTGTTCCCAATTCAGGAGTCAGCTTGCTGATTCCCGCTGG 1676 

1572 T GC C AT ACCCC GAGGGAAGAT CT AT GAGAT CTACCT CAC GCT GCACAAGC C GGAAGAC GT 1631 

I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I III I 
1677 GGCCATTCCCCAAGGGAGAGT CT AC GAAAT GTAT GT GACT GTACACAGGAAAGAAACT AT 1736 

1632 GAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCC 1691 

I I I I I I I I I I I I I I I I I I I I I III II I I I I I I I I I I I I I I I I 

1737 GAGGC CAC CC AT GGAT GACT CT CAGACACTTTT GAC CCCT GT GGT GAGCT GTGGGCCCCC 1796 

1692 TGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCC 1751 

III I I I I I I I I I I I I I I II I I I I I II I I I I II I II I I I I I I I I 

1797 AGGAGCTCT GCT C ACCC GC CCAGT C GT C CT CACTAT GCAT C ACT GCGCAGAC C C CAAT AC 1856 

1752 TGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCT 1811 

II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I 
1857 CGAGGACT GGAAAAT ACT GCT CAAGAACCAGGCAGCACAGGGACAGT GGGAGGAT GT GGT 1916 

1812 GCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTG 1871 

I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I 

1917 GGT GGT CGGGGAGGAAAACT T CAC CAC C C CCTGCTACATT CAGCT GGAT GC AGAGGCCT G 1976 

1872 CTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGC 1931 

I I I I I I I I I I I I I I I II II I I I I I I I I I I I I II III II 
1977 CCACAT CCTCACAGAGAACCT CAGCACCTACGCCCT GGTAGGACATTCCACCACCAAAGC 2036 

1932 TGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTA 1991 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I 

2037 GGCTGCGAAGCGCCTCAAGCTGGCCATCTTTGGGCCCCTGTGCTGCTCCTCGCTGGAGTA 2096 

1992 CAACATCCGGGT CTACTGCCT GCAT GACACCCACGATGCACTCAAGGAGGT GGTGCAGCT 2051 

II I I I I I I I I I I I I I I III II III I I III III I I II I II I I I I I I I I 
2097 CAGCATCCGAGT CTACTGT CTGGAT GACACCCAGGATGCCCTGAAGGAAATTTTACAT CT 2156 

2052 GGAGAAGCAGCT GGGGGGACAGCTGAT CCAGGAGCCACGGGTCCTGCACTTCAAGGACAG 2111 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I 1 1 1 1 II 1 1 1 1 II 1 1 I 1 1 1 

Db 2157 T GAGAGACAGAT GGGAGGACAGCT CCTAGAAGAAC CTAAGGCT CTT C ATTT T AAAGGCAG 2216 

Qy 2112 TT AC C ACAAC CT GC GCCT AT CCAT CCACGAT GT GC C CAGCT C C CT GT GGAAGAGTAAGCT 2171 

I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 2217 CACC C ACAAC CT GC GCCT GT CAATT CACGAT AT C GCCCAT T C CCT CT GGAAGAGCAAATT 227.6 

Qy 2172 CCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCGGTACTT 2231 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I III I III 
Db 2277 GCT GGCTAAAT AT C AGGAAATT C CAT TT T AC CAT GT TT GGAGT GGAT CT CAAAGAAAC CT 2336 

Qy 2232 GCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCT 2291 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2337 GCACTGC AC CT T CACTCT GGAAAGATTT AGC CT GAAC AC AGT GGAGCTGGTTT GCAAACT 2396 

Qy 2292 GT GGGTGT GGCAGGT GGAGGGCGAC GGGCAGAGCTT CAGCAT CAACTTCAACAT CAC CAA 2351 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I MINIMI! I I 

Db 2397 CTGTGTGCGGCAGGTGGAAGGAGAAGGGCAGAT CTT CCAGCTCAACTGCACCGTGT CAGA 2456 

Qy 2352 GGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGT 2411 

I I I I I I I I I I I I I I I I II I I I I I 

Db 2457 GGAACCTACTGGCATCGATTTGCCGCTGCTGGATCCTGCGAACACCATCACCACGGTCAC 2516 

Qy 2412 GGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTGGA 2471 

I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I 
Db 2517 GGGGCCCAGTGCTTTCAGCATCCCTCTCCCTATCCGGCAGAAGCTCTGTAGCAGCCTGGA 2576 

Qy 2472 C C CACC CTGT AGGC GGGGT GCCGACT GGC GGACT CT GGC C C AGAAACT C CACCT GGACAG 2531 

I III I I I II I I I I I I III I I I I I II I II M I I I I I I I I I I 

Db 2577 T GC C CC CCAGAC GAGAGGC CAT GACT GGAGGAT GCT GGC CCAT AAGCT GAAC CT GGACAG 2636 

Qy 2532 CCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGA 2591 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2637 GTACTTGAATTACTTTGCCACCAAATCCAGCCCAACTGGCGTAATCCTGGATCTTTGGGA 2696 

Qy 2592 GGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGG 2651 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I 
Db 2697 AGCACAGAACTT CCCAGATGGAAACCTGAGCATGCT GGCAGCT GTCTTGGAAGAAATGGG 2756 

Qy 2652 CCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2697 

I II II III II I I I I III I I 
Db 2757 AAGAC AT GAAAC GGT GGT GT CCTT AGCAGCAGAAGGGCAGT ATTAA 2802 
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AY406493 2791 bp DNA linear GSS 15-DEC-2003 

Mus musculus UNC5C gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY406493 

AY406493.1 GI: 39762467 
GSS. 

Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Rodentia; 
1 (bases 1 to 2791) 



Craniata ; Vertebrata ; Euteleostomi ; 
Sciurognathi; Muridae; Murinae; Mus. 



AUTHORS 



TITLE 

JOURNAL 
PUBMED 
REFERENCE 
AUTHORS 



TITLE 
JOURNAL 

COMMENT 

FEATURES 

source 



gene 



ORIGIN 



Clark, A. G., Glanowski, S . , Nielson,R., Thomas, P., Ke jariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D. R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 

Inferring nonneutral evolution from human- chimp-mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 

2 (bases 1 to 2791) 

Clark, A. G-, Glanowski, S . , Nielson,R., Thomas, P., Ke jariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 
Direct Submission 

Submitted ( 16-NOV-2003) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 

This sequence was made by sequencing genomic exons and ordering 
them based on alignment. 

Location/Qualifiers 

1. .2791 

/organism="Mus musculus" 

/mol_type=" genomic DNA" 

/db_xref= M taxon: 10090" 

<1. .>2791 

/gene="UNC5C" 

/ locus_t ag= "HCM2 575" 



Query Match 35.2%; 
Best Local Similarity 62.3%; 
Matches 1653; Conservative 



Score 950.4; DB 9; 
Pred. No. 2.3e-192; 
0; Mismatches 921; 



Length 2791; 
Indels 80; 



Gaps 



7; 



Qy 
Db 



104 TGCCTGGTGCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATGTGTACA 163 

III III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

158 TT C CAT CT GAC C CAC CT GAGCCATT GC CAC ACTT C CT C ATT GAGC C C GAGGAAGCT T ACA 217 



Qy 

Db 

Qy 

Db 

Qy 

Db 



164 TCGTCAAGAACAAGCCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCT 223 

I I I I II I I I I I I I I I I I II M II III I I I II I I I I I II I I I I 

218 TT GT GAAGAACAAGCCT GT GAAC CT GTATT GTAAAGC CAGCCCT GC CAC C CAGAT CT ACT 277 

224 T CAAGT GCAAC GGGGAGT GGGT GCGCCAGGT GGAC CAC GT GAT C GAGCGC AGCACAGAC G 283 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I III II I I I I 

278 TCAAGTGCAACAGCGAGT GGGTTCAT CAGAAGGACCACGT AGTAGACGAGAGAGTAGATG 337 

284 GGAGCAGT GGGCTGCCCAC CAT GGAGGT CC GCATTAAT GrT CT CAAGGCAGCAGGT CGAGA 343 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

338 AAACCT CT GGTCTAATTGT GAGAGAAGTGAGCATT GAGATTTCACGCCAGCAGGTGGAGG 397 



Qy 

Db 

Qy 

Db 



344 AGGTGTTCGGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCA 403 

I I I I I I I I I II II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
398 AACT GTTT GGGCCT GAAGATTACT GGTGCCAGTGT GT GGC CTGGAGCT CAGCAGGCACTA 457 

404 CCAAGAGTCAGAAGGCCTACATCCGCATAGCCAG ATT GCGCAAGAACTTC GAGC 457 

I I I I I I I I I II I II III I I I I I I II II I I III I I I I I I II 

458 CGAAGAGT C GGAAGGCAT ACGT GCGCATT GC GTT T CCAGAT CT GCGGAAGACATT C GAGC 517 



Qy 



458 AGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCAC 517 



1 1 1 1 1 1 III 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 I 1 1 1 1 1 1 1 1 

518 AGGAACCCTTGGGAAAGGAAGTGTCCTTGGAGCAGGAAGTCTTACTCCAGTGTCGGCCAC 577 

518 CGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGT 577 

I I I II I I I I I I II I I I I I I I I I I I I I I I II I I 

578 CTGAAGGGATCC GT AGAAT GGCTAAAGAAT GAAGAC ATAATT GAT CCT G 626 

578 CCCT GGAC C CCAAT GT AT AC AT C AC GC GGGAGC ACAGC CT GGTGGT GCGAC AGGCC CGC C 637 

I III II I I I I I I I I I I I I I I I I I I I I I I I II I I 

627 CT GAAGAT CGGAACTTTT AT AT TACT AT C GAT CACAAC CT GAT CAT CAAGCAAGCC C GAC 686 

638 TTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCG 697 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

687 T CT CAGATAC AGCAAAT T AT ACCT GT GTT GCCAAAAAT AT T GTT GC CAAGAGAAAAAGCA 746 

698 CCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCG 757 

II I II I I I I I I I I I I II II II I I I I I I I I I I II I I I I I I I I I I I I I I 

747 CCACAGCCACTGTCATCGTGTATGTTAATGGTGGCTGGTCCACCTGGACAGAGTGGTCTG 806 

758 TCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGG 817 

I I I I I I I I I I I I I I I I I I I MINIM I I I I I I I I I I I I I I I I 
807 T GT GTAACAGCCGCT GT GGGCGAGGAT AT CAGAAACGCACAAGAACCTGCAC CAAC CC AG 866 

818 CGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCA 877 

I II I I I I I II II II I I I I I I I I I I I I II I I III I I I II I I I I I III I I 
867 CCC CACT CAATGGT GGGGC CTT CT GT GAGGGGCAGAGT GT GC AGAAAAT AGCAT GCACT A 926 

878 CCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGG 937 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I MINIM I 
927 C GTT AT GT C CAGTGGAT GGT AGGT GGACTT CATGGAGCAAAT GGT CAACCT GTGGGACTG 986 

938 ACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGG 997 

I II I II I II I I I I I I I I I I I I II II MINIM I I I I I I I II I 
987 AAT GCAC C CACT GGC GC AGGAGGGAGTGT ACAGCACCAGCC CCCAAGAAC GGGGGTAAGG 1046 

998 AGT GCCAGGGCACT GAC CT GGACACCCGCAACTGTACCAGT GAC CT CTGT GT ACACAGTG 1057 

III I II I Mil I II I I I II I I II I I I I III II 
1047 ACT GT GAT GGCCT GGTC CT C C AAT CCAAGAACT GCACT GAT GGGCT GTGCAT GCAGGCT G 1106 

1058 CTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGG — --CCTCATCGCCGTGGCCGTCTGCC 1114 

I I I II I I II I I II II I II I II I I I I I I II I II II I II I I I I 

1107 CT C CTGACT CAGAT GAT GT GGCT CT CTACGT GGGGATTGT GAT C GCT GTAAC AGT CT GTC 1166 

1115 TGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACT 1174 

III I I I I I I I I II I II I I I I I I I II I 

1167 T GGC GAT CACT GTT GTGGT GGC C CT GTTT GT GT AT C GGAAGAAC C ACCGT GACT TT GAGT 1226 

1175 CAGATGTGGCTGACTCGTCCATTCTCACCTCAGGCTTCCAGCCCGTCAGCATCAAGCCCA 1234 

III I I I I I II II I I I I II I I I I I II I II I I I II II I 
1227 CT GACAT CATTGACT CCT C AGCACT CAAT GGCGGCTTT CAGCCT GT GAACAT CAAG 1282 

1235 GCAAAGCAGACAAC CCC CAT CT GCT CAC CAT CCAGCCGGACCTCAGCAC CAC CACC ACCA 1294 

I I I I I I II I I I I I III I I I M II II I I I I III 
1283 GCT GCCAGACAAGAT CT CCT GGCT GTCC C C CCT GAC CTC AC CTCAGCTGCAGC CA 1337 

1295 CCTACCAGGGCAGTCTCTGTCCCCGGCAGGATG GGC C CAGC C CCAAGTT CCAGCT 1349 

IN III I Ml I I I III MM II I I I II I INN 



1338 T GT ACAGGGGACCT GT CT AT GCT CT GC AT GAT GTCT CAGACAAAAT C C CAAT GAC CAACT 1397 



1350 CACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACACACTGCACCACAGCTC 1409 

I I I I I I I I I I I I I I I I I I I III 

1398 CTCCAATTCT GGAC CCACT AC C CAACT T GAAAATCAAAGTGT ACAACAGCT CAGGT GCT G 1457 

1410 TCCCACCTC TGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCC 1453 

I I I I I I I III I I II I I I III I I I I III 

1458 T CACTC CT CAGGAT GACCT T GCC GAGTT CT C AT CCAAACTGT CAC C C C AGAT GAC C C AGT 1517 

1454 AGAACTACTTCCGCTCCCTGCCCCGAGGCA 1483 

II I I I I I I I I I II 

1518 C CTT GCT AGAGAAT GAGGCCCTT AACCT GAAGAACCAGAGC CT CGCAAGAC AGACT GACC 1577 

1484' C CAGCAACAT GAC CTAT GGGACCTT CAACTT CCTC GGGGGCCGGCTGAT GAT C CCT AAT A 154 3 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1578 CAT C CT GCACAGC ATT T GGT AC CT T CAACT CT CTT GGGGGT CACCTCAT CAT T CCT AAT T 1637 

1544 C AGGTAT CAGCCT CCT C AT CC C CC CAGAT GCCAT AC CCC GAGGGAAGAT CTAT GAGAT CT 1603 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

1638 CAGGAGTAAGCTT GCT GATT CC C GCT GGGGCCATT CCT C AGGGGAGAGT CTAT GAAAT GT 1697 

1604 ACCTCACGCTGCACAAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGC 1663 

I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1698 ATGTGACTGTACACAGGAAAGAAAATAT GAGGCCCCCCATGGAAGACTCT CAGACCCTAC 1757 

1664 TGAGTCCCATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGG 1723 

II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1758 TTACCCCTGTGGTGAGCTGTGGGCCTCCTGGAGCTCTGCTGACCCGCCCTGTCATCCTCA 1817 

1724 CTAT GGACCACT GT GGGGAGCC C AGC CCT GACAGCT GGAGC CT GC GCCT CAAAAAGCAGT 1783 

I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

1818 CTCT GCATCACT GT GCAGACC CC AGCAC C GAGGACT GGAAGAT C C AGCT CAAAAACCAGG 1877 

1784 CGTGCGAGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCT 1843 

I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I 

1878 CAGTGCAGGGACAATGGGAGGATGTTGTGGTGGTTGGGGAGGAGAACTTCACAACCCCCT 1937 

1844 ACTACTGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTG 1903 

III MM II II II II III I II II II III I II I II II 

1938 GTTACATTCAGCT GGAT GCAGAGGCTT GC CAT AT CCTCACAGAGAAC CT CAGT ACCT AT G 1997 

1904 CCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTG 1963 

I I I II I I I I I I II III II I I I II I I II I II I I I I I Mill 

1998 CCCTGGTTGGGCAGTCCACCACCAAAGCAGCTGCCAAGCGTCTTAAACTGGCCATCTTTG 2057 

1964 CGCCGGTGGCCTGCACCTCCCTCGAGTACAACATCCGGGTCTACTGCCTGCATGACACCC 2023 

III I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I 

2058 GGC CCCT CT GCT GCT CTT CCCT GGAGT ACAGC ATT AGAGTCT ACT GC CT GGAT GACAC AC 2117 

2024 ACGATGCACT CAAGGAGGT GGT GC AGCT GGAGAAGC AGCT GGGGGGACAGCT GAT CCAGG 2083 

I I I I I I I I I I I I I I I I I I I II I II I II I I I I I I I I II I I I I II 

2118 AGGATGCCCT GAAGGAAGT T CT ACAACT GGAGAGGCAAAT GGGAGGACAGCT CCT AGAAG 2177 

2084 AGCCAC GGGT CCT GCACT T CAAGGAC AGT T ACC ACAAC CT GCGCCT AT C CAT CCACGAT G 2143 

I II II II II II II I III I I I I II I I II I I II I II II II II 

2178 AACC CAAGGCTCTTCATT TTAAAGGC AGCATC CACAAC CT GC GCCT GT CT ATT CAT GAC A 2237 



Qy 2144 TGCCCAGCTCCCTGTGGAAGAGTAAGCTCCTTGTCAGCTACCAGGAGATCCCCTTTTATC 2203 

I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2238 T CGCCCATT C CCT CT GGAAGAGCAAATT GCT GGCTAAGT AT CAGGAAAT T C C ATT TT ACC 2297 

Qy 2204 ACATCTGGAATGGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCC 2263 

I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2298 AC AT CT GGAGT GGCT CT CAAAGAAACCT CC ACT GC ACCTTC ACT CTGGAAAGACT CAGC C 2357 

Qy 2264 CCAGCACTAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGA 2323 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 2358 TAAAC ACAGT GGAACT GGTTT GCAAACT CT GT GT GCGGCAGGTT GAAGGAGAAGGGCAGA 2417 

Qy 2324 GCT T C AGCAT CAACT T CAAC AT C ACCAAGGAC ACAAGGT TT GCT GAGCT GCT GGCT CT GG 2383 

I I I I 111(11 I I I I I I I II II II I I I I 

Db 2418 T CTT CCAGCT CAACT GT ACT GT GT CAGAGGAAC CT ACT GGCATCGACT T AC CT CT C CT GG 2477 

Qy 2384 AGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCA 2443 

I II III I I I I I I I I I I I I I I I I I I I III I 

Db 2478 ACC CTGCTAGTACCAT CAC CACT GT CAC CGGAC CAAGT GCTT TCAGCATT C CT CT C C CT A 2537 

Qy 2444 TTCGGCAGAAGATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGA 2503 

I I I I I I I I I I I I I I I I I I I I I III I III I II I I I I I I 

Db 2538 T CC GGC AGAAGCT AT GCAGC AGC CT GGAT GCC C CT CAAACAAGAGGCCAT GACT GGAGGA 2597 

Qy 2504 CTCTGGCCCAGAAACTCCACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCC 2563 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 2598 TGCTGGCCCATAAACTCAACCTGGACAGGTACTTGAATTACTTTGCCACCAAATCGAGCC 2657 

Qy 2564 CCACAGCCATGATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCC 2623 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2658 CAACT GGCGTAAT CCT GGAT CTT T GGGAAGCAC AGAACTT C C CAGAT GGAAAC CT GAGCA 2717 

Qy 2624 AGCTGGCTGCAGCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGG 2683 

I I I I I I I I I III I I I I I I I II II III I II 

Db 2718 T GCT GGCAGCCGT CCT GGAAGAAAT GGGAAGAC AT GAGACAGTGGTGT CCT T GGC AGCAG 2777 

Qy 2684 AGGCTGAGTGCTGA 2697 

II III III 

Db 2778 AAGGAC AGT ATT GA 2791 
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AK031655 3790 bp mRNA linear HTC 03-APR-2004 

Mus musculus 13 days embryo male testis cDNA, RIKEN full-length 
enriched library, clone : 6030473H24 product:unc5 homolog (C. 
elegans) 3, full insert sequence. 
AK031655 

AK031655 . 1 GI : 26327502 
HTC; CAP trapper. 
Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Rodentia; 
1 

Carninci,P. and Hayashizaki, Y. 



Craniata; Vertebrata; Euteleostomi ; 
Sciurognathi; Muridae; Murinae; Mus, 



TITLE High-efficiency full-length cDNA cloning 

JOURNAL Meth. Enzymol. 303, 19-44 (1999) 
MEDLINE 99279253 
PUBMED 10349636 
REFERENCE 2 

AUTHORS Carninci,P., Shibata,Y., Hayatsu,N., Sugahara,Y., Shibata,K., 

Itoh,M., Konno,H., Okazaki,Y., Muramatsu,M. and Hayashizaki, Y. 
TITLE Normalization and subtraction of cap-trapper-selected cDNAs to 

prepare full-length cDNA libraries for rapid discovery of new genes 
JOURNAL Genome Res. 10 (10), 1617-1630 (2000) 
MEDLINE 20499374 
PUBMED 11042159 
REFERENCE 3 

AUTHORS Shibata,K., Itoh,M., Aizawa,K., Nagaoka,S., Sasaki, N., Carninci,P., 
Konno,H., Akiyama,J., Nishi,K., Kitsunai,T., Tashiro,H., Itoh,M., 
Sumi,N., Ishii,Y., Nakamura,S., Hazama,M. , Nishine,T., Harada,A. , 
Yamamoto,R., Matsumoto, H. , Sakaguchi, S . , Ikegami,T., Kashiwagi, K. , 
Fujiwake,S., Inoue,K., Togawa,Y., Izawa,M., Ohara,E., Watahiki,M., 
Yoneda,Y., Ishikawa,T., Ozawa,K., Tanaka,T., Matsuura,S., Kawai,J., 
Okazaki,Y., Muramatsu,M. , Inoue,Y., Kira,A. and Hayashizaki, Y . 

TITLE RIKEN integrated sequence analysis (RISA) system — 384-format 

sequencing pipeline with 384 multicapillary sequencer 

JOURNAL Genome Res. 10 (11), 1757-1771 (2000) 

MEDLINE 20530913 
PUBMED 11076861 
REFERENCE 4 

AUTHORS The RIKEN Genome Exploration Research Group Phase II Team and the 

FANTOM Consortium. 
TITLE Functional annotation of a full-length mouse cDNA collection 

JOURNAL Nature 409, 685-690 (2001) 
REFERENCE 5 

AUTHORS The FANTOM Consortium and the RIKEN Genome Exploration Research 
Group Phase I & II Team. 

TITLE Analysis of the mouse transcriptome based on functional annotation 

of 60,770 full-length cDNAs 

JOURNAL Nature 420, 563-573 (2002) 
REFERENCE 6 (bases 1 to 3790) 

AUTHORS Adachi,J., Aizawa,K., Akimura,T., Arakawa,T., Bono,H., Carninci,P., 
Fukuda,S., Furuno,M., Hanagaki,T., Hara,A., Hashizume, W. , 
Hayashida, K. , Hayatsu,N., Hiramoto,K., Hiraoka,T., Hirozane,T., 
Hori,F., Imotani,K., Ishii,Y., Itoh,M., Kagawa,I., Kasukawa,T., 
Katoh,H., Kawai,J., Kojima,Y., Kondo,S., Konno,H., Kouda,M., 
Koya,S., Kurihara,C, Matsuyama, T . , Miyazaki,A. , Murata,M., 
Nakamura,M., Nishi,K., Nomura, K. f Numazaki,R., Ohno,M., Ohsato,N., 
Okazaki,Y., Saito,R., Saitoh, H w Sakai,C, Sakai,K., Sakazume,N., 
Sano,H., Sasaki, D., Shibata,K., Shinagawa,A. , Shiraki,T., 
Sogabe,Y., Tagami,M., Tagawa,A. , Takahashi, F. , Takaku-Akahira, S . , 
Takeda,Y., Tanaka,T., Tomaru,A., Toya,T., Yasunishi, A. , 
Muramatsu,M. and Hayashizaki, Y. 

TITLE Direct Submission 

JOURNAL Submitted ( 16- JUL-2001 ) Yoshihide Hayashizaki, The Institute of 
Physical and Chemical Research (RIKEN), Laboratory for Genome 
Exploration Research Group, RIKEN Genomic Sciences Center (GSC) , 
RIKEN Yokohama Institute; 1-7-22 Suehiro-cho, Tsurumi-ku, Yokohama, 
Kanagawa 230-0045, Japan (E-mail : genome-res @gsc . riken . jp, 
URL :http: //genome. gsc. riken. jp/, Tel : 81-45-503-9222 , 
Fax:81-45-503-9216) 



COMMENT 



FEATURES 

source 



CDS 



cDNA library was prepared and sequenced in Mouse Genome 
Encyclopedia Project of Genome Exploration Research Group in Riken 
Genomic Sciences Center and Genome Science Laboratory in RIKEN. 
Division of Experimental Animal Research in Riken contributed to 
prepare mouse tissues. 

Please visit our web site for further details. 
URL : http : / /genome . gsc . riken . jp/ 
URLrhttp : / /fantom. gsc . riken . jp/ . 

Location/Qualifiers 

1. .3790 

/organism="Mus musculus" 
/mol_type=="mRNA" 
/strain="C57BL/6J" 
/db_xref="FANTOM_DB: 6030473H24" 
/db_xref="taxon: 10090" 
/clone="6030473H24" 
/sex="male" 
/tissue__type=" testis" 

/clone_lib=" RIKEN full-length enriched mouse cDNA library" 
/dev_stage="13 days embryo" 
118. .2970 

/note="unnamed protein product; putative 

unc5 homolog (C. elegans) 3 (MGD | MGI : 1095412, 

GB|NM_009472, evidence: BLASTN, 99%, match=464)" 

/ codon_start=l 

/protein__id="BAC27495.1" 

/db_xref ="GI : 26327503" 

/translation="MRKGLRATAARCGLGIGYLLQMLVLPALALLSASGTGSAAQDDE 
FFHELPETFPSDPPEPLPHFLIEPEEAYIVKNKPVNLYCKASPATQIYFKCNSEWVHQ 
KDHWDERVDETSGLIWEVSIEISRQQV^ELFGPEDYWCQCVAWSSAGTTKSRKAYV 
RIAYLRKTFEQEPLGKEVSLEQEVLLQCRPPEGIPVAEVEWLKNEDIIDPAEDRNFYI 
T I DHNLI I KQARLS DTAN YTCVAKNI VAKRKSTTATVI VYVNGGWSTWTEWSVCNS RC 
GRGYQKRTRTCTNPAPLNGGAFCEGQSVQKIACTTLCPVDGRWTSWSKWSTCGTECTH 
WRRRECTAPAPKNGGKDCDGLVLQSKNCTDGLCMQGFIYPISTEHRPQNEYGFSSAPD 
SDDVALWGIVIAVTVCLAITVWALFVTRKNHRDFESDIIDSSALNGGFQPWIKAA 
RQDLLAVPPDLTSAAAMYRGPVTALHDVSDKIPMTNSPILDPLPNLKIKVYNSSGAVT 
PQDDLAEFSSKLSPQMTQSLLENEALNLKNQSLARQTDPSCTAFGTFNSLGGHLIIPN 
S GVS LL I PAGAI PQGRVYEMYVT VHRKENMRP PMEDS QT LLT PWS CGP PGALLT RP V 
I LT LHH CAD P S T EDWK I QL KNQAVQGQWEDWWGEEN FTT P C Y I QL DAEACH I LT EN 
LSTYALVGQSTTKAAAKRLKLAI FGPLCCSSLEYSIRVYCLDDTQDALKEVLQLERQM 
GGQLLEEPKALRFKGSIHNLRLSIHDIAHSLWKSKLLAKYQEIPFYHIWSGSQRNLHC 
TFTLERLSLNTVELVCKLCVRQVEGEGQIFQLNCTVSEEPTGIDLPLLDPASTITTVT 
GPSAFSI PLPI RQKLCSSLDAPQTRGHDWRMLAHKLNLDRYLNYFATKS S PTGVI LDL 
WEAQNFPDGNLSMLAAVLEEMGRHETVVYLAAEGQY" 



ORIGIN 



Query Match 34.2%; 
Best Local Similarity 61.3%; 
Matches 1659; Conservative 



Score 923.4; DB 3; 
Pred. No. 1.4e-186; 
0; Mismatches 926; 



Length 3790; 
Indels 120; 



Gaps 



6; 



Qy 

Db 



104 TGCCTGGTGCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATGTGTACA 163 

III III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
275 TT CCAT CT GAC C CACCT GAGCCAT T GCCAC ACT T C CT C AT T GAGCC C GAGGAAGCTT ACA 334 



Qy 

Db 



164 TCGTCAAGAACAAGCCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCT 223 

I I I II I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I II I I 

335 TT GT GAAGAACAAGCCT GT GAAC CT GT ATT GTAAAGCCAGCCCT GCCAC C CAGAT CT ACT 394 



Qy 224 T CAAGT GCAACGGGGAGTGGGTGC G CCAGGT GGAC C ACGT GAT CGAGC GCAGCACAGACG 283 

I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I III M I I I I 

Db 395 T CAAGT GCAACAGCGAGT GGGTT CAT CAGAAGGACC AC GT AGTAGACGAGAGAGT AGAT G 454 

Qy 284 GGAGCAGT GGG CT GC CCAC CATGGAGGT C CGC AT TAAT GT CT CAAGGCAGCAGGT C GAGA 343 

II Mill I II II I I I I I I I I I I I I I I I I I I I I I I 

Db 455 AAACCTCT GGT CTAATTGT GAGAGAAGTGAGCATTGAGATTTCACGCCAGCAGGTGGAGG 514 * 

Qy 344 AGGTGTTCGGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCA 403 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 515 AACTGTTTGGGCCTGAAGATTACTGGTGCCAGTGTGTGGCCTGGAGCTCAGCAGGCACTA 574 

Qy 404 CCAAGAGT CAGAAGGCCT AC ATCC GC AT AGCC AGAT T GC GCAAGAACTT C GAGC AGGAGC 463 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 575 CGAAGAGT CGGAAGGCATACGTGC GC ATT GC GT AT CT GC GGAAGACATT C GAGCAGGAAC 634 

Qy 464 CGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGG 523 

I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 635 CCTTGGGAAAGGAAGTGTCCTTGGAGCAGGAAGTCTTACTCCAGTGTCGGCCACCTGAAG 694 

Qy 524 GCATCCCTCCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGG 583 

I I II I I I I II I I I I I I I I I I III II Ml I I I I II I I 

Db 695 GGAT CCCAGTGGCTGAGGTAGAATGGCTAAAGAAT GAAGACATAATTGATCCTGCTGAAG 754 

Qy 584 ACC C CAAT GT AT ACAT CAC GC GGGAGCACAGC CT GGT GGT GC GACAGGCCC GC CT T GCT G 643 

II II I I I II I I II I I II I I II I I I I I II I I I I II 

Db 755 ATCGGAACTTTT ATATT ACT ATCGAT CACAAC CTGAT CAT CAAGCAAGCCCGACT CT CAG 814 

Qy 644 ACACGGCCAACTACACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCG 703 

I II II I II I I I II II I I I I M I I I II I I I I I 

Db 815 AT AC AGCAAATT AT AC CT GTGTT GC CAAAAAT ATT GTT GCCAAGAGAAAAAGCAC C ACAG 874 

Qy 704 CTGCTGTCATCGTCTACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCA 763 

I II I II I II II I I I I II II I II I I I I I II II I II M I I M M I I I I I 
Db 875 CCACT GT CATC GT GTAT GTTAAT GGTGGCTGGT CCACCT GGACAGAGT GGT CT GT GT GT A 934 

Qy 764 GCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTC 823 

I I I II I I II I II I I I II I II I II I I I II II I I I II II I II I I I 

Db 935 ACAGCCGCT GT GGGCGAGGAT AT CAGAAAC GCACAAGAACCT GCAC CAAC CCAGCCCCAC 994 

Qy 824 T CAAC GGGGGC GCTT T CT GT GAGGGGCAGAAT GT C C AGAAAACAGCCT GC GC CACCCT GT 883 

I I I I II I I I I I II II I II II II II II I I I II II II I II I I II I I I II 
Db 995 T CAATGGT GGGGC CTT CT GT GAGGGGCAGAGT GT GCAGAAAAT AGCAT GC ACTAC GTT AT 1054 

Qy 884 GCCCAGTAGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCA 943 

I Mill II M M MM I II II I I II II I II II II II II II II I I 

Db 1055 GT C CAGT GGAT GGT AGGTGGACTT CAT GGAGCAAAT GGT CAAC CT GT GGGACT GAAT GCA 1114 

Qy 944 CCCACT GGCGGAGC CGT GAGT GCT CT GAC CCAGCAC CCC GCAACGGAGGGGAGGAGT GC C 1003 

II II II II II II I II II I II II I II II I II II I II II II II 

Db 1115 CCCACT GGCGCAGGAGGGAGT GT ACAGC ACCAGCC C C CAAGAAC GGGGGT AAGGACT GT G 1174 

Qy 1004 AGGGCACT GACCT GGAC ACCCGCAACT GT AC CAGT GACCT CT GT GTACACAG 1055 

I I II I III I II II II I M M M II III I 
Db 1175 AT GGC CT GGT C CT CCAAT C CAAGAACT GCACT GAT GGGCT GTGCAT GCAGGGATT CATTT 1234 



Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db - 

Qy 

Db 

Qy 

Db 

Qy 



1056 



1235 



1067 



TGCTTCTGGCC 1066 

I I I I III I 

ACCCCATTT CAACT GAGCACAGACC C CAGAAT GAAT AT GGAT TT T CT T CT GCT C CT GACT 1294 



CTGAGGACGTGGCCCTCTATGTGGG CCTCATCGCCGTGGCCGTCTGCCTGGTCCTGC 1123 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1295 CAGATGATGTGGCTCTCTACGTGGGGATTGTGATCGCTGTAACAGTCTGTCTGGCGATCA 1354 

1124 TGCTGCTTGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGG 1183 

I III II I I I I I I I III I I I I I I I I I I 

1355 CTGTTGTGGTGGCCCTGTTTGTGTATCGGAAGAACCACCGTGACTTTGAGTCTGACATCA 1414 

1184 CTGACT C GT C CATTCT CAC CT CAGGCTT CCAGC CC GT CAGC AT CAAGCCC AGCAAAGCAG 1243 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I III 
1415 TTGACT C CT CAGC ACT CAAT GGC GGCT TT CAGC CT GT GAAC AT CAAG GCTG 1465 

1244 ACAACCCCCATCTGCTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGG 1303 

II I I I I I I I I III I I I I I I II I I I I I III III II 
1466 CCAGACAAGATCT CCT GGCT GT C C C C C CT GACCTCACC T CAGCT GCAGCCAT GTACAGGG 1525 

1304 GC AGT CT CT GT C C CC GGC AGGAT G GGC C CAGC C C CAAGT T C CAGCT CAC C AAT GG 1358 

I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I 

1526 GACCTGT CTATGCTCTGCATGATGTCT CAGACAAAATC CCAATGAC CAACT CTCCAATTC 1585 

1359 GCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTC 1418 

I I I I I I I I I I I I I I I I I I I I I I I 

1586 T GGACCCACT AC C CAACTTGAAAAT CAAAGT GT ACAAC AGCT CAGGT GCT GT CACT CCT C 1645 

1419 TGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCC 1453 

III I I I I I I I III I I I I III 

1646 AGGATGACCTTGCCGAGTTCTCATCCAAACTGTCACCCCAGATGACCCAGTCCTTGCTAG 1705 

1454 AGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACA 1492 

I I I I I I I I I I I III III 

1706 AGAAT GAGGC CCT TAAC CT GAAGAAC CAGAGC CT C GCAAGAC AGACT GAC C CAT C CT GC A 1765 

1493 TGACCTATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCA 1552 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

1766 CAGCATTT GGTAC CT T CAACT CTCTT GGGGGT CACCT C ATCATT C CTAAT T C AGGAGTAA 1825 

1553 GCCTCCTCATCCCCCCAGATGCCATACCCCGAGGGAAGATCTATGAGATCTACCTCACGC 1612 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

1826 GCTTGCTGATTCCCGCTGGGGCCATTCCTCAGGGGAGAGTCTATGAAATGTATGTGACTG 1885 

1613 T GCACAAGC C GGAAGAC GT GAGGTT GC C C CT AGCT GGCT GT C AGACC CTGCTGAGT C C C A 1672 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

1886 T ACACAGGAAAGAAAAT AT GAGGC C C C C C AT GGAAGACT CT C AGACCCT ACTT ACC C CT G 1945 

1673 TCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACC 1732 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1946 TGGTGAGCTGTGGGCCTCCTGGAGCTCTGCTGACCCGCCCTGTCATCCTCACTCTGCATC 2005 

1733 ACTGTGGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGG 1792 

I III I I I I I I III I I I I I I I I I I I I I I I I III III I III 

2006 ACT GTGCAGACCCC AGCACC GAGGACT GGAAGAT CC AGCT CAAAAAC C AGGCAGT GCAGG 2065 

1793 GCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCC 1852 



2066 GACAAT GGGAGGAT GTT GT GGT GGT T GGGGAGGAGAACT T CACAACCCC CT GTT ACAT T C 2125 

1853 AGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGG 1912 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2126 AGCT GGAT GCAGAGGCTT GC CAT AT C CT CAC AGAGAAC CT C AGT AC CTAT GC CCT GGTTG 2185 

1913 GAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGG 1972 

I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2186 GGCAGTCCACCACCAAAGCAGCTGCCAAGCGTCTTAAACTGGCCATCTTTGGGCCCCTCT 2245 

1973 CCT GCACCT C C CT CGAGT ACAACAT CC GGGTCT ACT GC CT GC AT GACAC CCACGAT GC AC 2032 

I I I I I Mill I I II I I I III I I II I I I I I I I I I I I I I I I I II I I I I I I 
224 6 GCT GCT CT T C CCT GGAGT ACAGCATT AGAGT CT ACT GC CT GGAT GACACACAGGAT GC CC 2305 

2033 T CAAGGAGGT GGT GC AGCT GGAGAAGCAGCT GGGGGGAC AGCT GAT CCAGGAGC C ACGGG 2092 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II 
2306 TGAAGGAAGTTCT ACAACT GGAGAGGCAAAT GGGAGGACAGCTCCT AGAAGAAC C CAAGG 2365 

2093 T C CT GCACTT CAAGGAC AGT T ACCACAAC CT GC GC CT AT CCATCCACGAT GT GC C C AGCT 2152 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2366 CT CTT CGTTTTAAAGGCAGCAT CCACAACCT GC GC CT GT CT ATT CAT GACAT CGC C CATT 2425 

2153 CCCTGTGGAAGAGTAAGCTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGA 2212 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
2426 CCCTCTGGAAGAGCAAATTGCTGGCTAAGTATCAGGAAATTCCATTTTACCACATCTGGA 24 85 

2213 AT GGCACGCAGCGGT ACTT GCACT GCAC CT T CAC C CT GGAGC GT GT CAGCCCCAGCACTA 2272 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
2486 GT GGCT CT CAAAGAAAC CT C CACT GCAC CTT CACT CT GGAAAGACT CAGCCTAAACACAG 2545 

2273 GTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCA 2332 

II I I I I I I I I I II II I I I I I I I I I I I I II II I I I I I I I MM 
254 6 T GGAACT GGTT T GCAAACT CT GT GT GCGGCAGGT T GAAGGAGAAGGGCAGAT CT T C CAGC 2605 

2333 TCAACTT CAACAT CACCAAGGACACAAGGTTTGCT GAGCT GCT GGCT CTGGAGAGTGAAG 2392 

I II II I I I I II II II M II Mill II 

2606 T CAACT GT ACTGT GT CAGAGGAAC CT ACT GGCAT C GACT T AC CT CT C CT GGACC CT GCT A 2665 

r 

2393 CGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGA 2452 

II I I I II I I II I M II I I I I I I III M I M I I II 

2666 GT AC CAT CAC CACT GTCACCGGAC CAAGT GCTT T CAGCATT C CT CT CCCT AT CC GGCAGA 2725 

2453 AGATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCC 2512 

II II I II II II II III I III I I II M I I I I II II II 
2726 AGCT AT GCAGCAGCCTGGAT GC C C CT CAAACAAGAGGCC AT GACT GGAGGAT GCT GGC C C 2785 

2513 AGAAACT C CACCT GGACAGC CAT CT CAGCT T CTT T GC CT CCAAGC CCAGCCCCACAGCC A 2572 

I M II II I I I I II II II I II I II I I II I M I I I II I I I I I I I 
2786 ATAAACT CAACCT GGACAGGT ACT T GAATT ACTT T GC CAC CAAAT C GAGCCCAACT GGCG 2845 

2573 TGATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTG 2632 

I I I I II I I I I II I I II I I I II I II I I I I II I I I II I II I I I I I 
2846 TAAT CCT GGATCTTT GGGAAGC ACAGAACTT CCCAGATGGAAAC CT GAGCAT GCT GGCAG 2905 

2633 CAGCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGT 2692 

II III I I II I I I II II III I I I I I III 



Db 2906 CC GT C CT GGAAGAAAT GGGAAGAC ATGAGACAGT GGT GT ACTT GGCAGC AGAAGGACAGT 2965 



Qy 2693 GCTGA 2697 

I I I 

Db 2966 ATTGA 2970 



RESULT 4 
CR598115 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 
REMARK 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 



COMMENT 



FEATURES 

source 



CR598115 1852 bp mRNA linear HTC 21-JUL-2004 

full-length cDNA clone CS0DA006YG16 of Neuroblastoma of Homo 
sapiens (human) . 
CR598115 

CR598115.1 GI:50478922 
HTC; CNSLT_cDNA. 
Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Crania.ta; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 1852) 

Li,W.B., Gruber,C, Jessee, J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished 

Contact : Feng Liang Email : fliang@lifetech.com URL : 
http://fulllength.invitrogen.com/ InVitroGen Corporation 1600 
Faraday Avenue 

2 (bases 1 to 1852) 
Genoscope . 

Direct Submission 

Submitted (20- JUL-2004 ) Genoscope - Centre National de Sequencage : 
BP 191 91006 EVRY cedex - FRANCE (E-mail : seqref@genoscope.cns.fr 
- Web : wvjw.genoscope.cns.fr) 

1st strand cDNA was primed with a Notl-oligo (dT) primer. Five prime 
end enriched, double-strand cDNA was digested with Not I and cloned 
into the Not I and EcoR V sites of the pCMVSPORT 6 vector. Library 
was normalized. Library was constructed by Life Technologies, a 
division of Invitrogen. 

Location/Qualifiers 

1. .1852 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/ cl one= " CS 0 DAO 0 6 YG 1 6 " 
/tissue_type="Neuroblastoma " 
/plasmid="pCMVSP0RT_6" 



ORIGIN 



Query Match 32.4%; Score 874; DB 3; Length 1852; 

Best Local Similarity 100.0%; Pred. No. 4.8e-176; 

Matches 874; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 



Qy 1824 GGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCAC 1883 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I 
Db 1 GGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCAC 60 



Qy 



1884 CGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCG 1943 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 


61 


CGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCG 


120 


Qy 


J. .7 ft *± 


rrTrAAfiPTGrTTrTGTTTGrGCrGGTGGCCTGCACCTCCCTCGAGTACAACATCCGGGT 


2003 




i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 




Db 


121 


CCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAACATCCGGGT 


180 


Qy 


Z UUfi 


PTAPTGPPTr:PATGAPAPPPAPftATGPAPTPAAGGAGGTGGTGCAGCTGGAGAAGCAGCT 


2063 




1 II 1 t 1 ! 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 II 1 1 11 1 1 II 1 




Db 


181 


CTACT GC CTGCAT GAC AC C CAC GAT GC ACT CAAGGAGGT GGT GC AGCTGGAGAAGCAGCT 


240 


Qy 




rr*rrr*pnr , Apr , Tr ATr , PAr;r;Ar;rrArf;r;riTr'rTnrAr , TTrAAGGArAGTTACrACAACCT 


2123 




I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


241 


GGGGGGACAGCT GAT CCAGGAGCCACGGGT CCT GC ACTT CAAGGACAGTTACC ACAACCT 


300 


Qy 


91 94 


rrrrrTATrr ATrPArf^AT^TnrrrA^rTrrrTPiTnGAAGAGTAAGCTCCTTGTCAGCTA 


2183 




| | | | I I I I I I I I I I 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


301 


GC GCCT AT CCAT C CAC GAT GT GCC CAGCT CCCT GT GGAAGAGT AAGCT CCT T GT CAGCT A 


360 


Qy 




U v^-M-Lj \jr\\jJ\ 1 w^^^> 111 1 /-VI K^r\\^J\.L \^ 1 k?vxrlr\.x boCA^Vj^riu^oolA^ X X \J\^r\\^ x vjv-.r'i.^v^ x x 


2243 




1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


361 


CCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCGGTACTTGCACTGCACCTT 


420 


Qy 


OO A A 
ft 


rarrrTrr apprzTfiTPAnppppAGP APTAnTftAPPTGCiPPTGPAAGPTGTGGGTGTGGCA 


2303 






1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 




Db 


421 


CACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCA 


480 


Qy 




rrTTrarrrrrarrrrrararr'TTrBrrATPAArTTrAArATrArrAAfinArArAAfiCTT 

Ljkj 1 (j(jAvj(j^CoAL,VjIj17W\wvjV-» 1 1 w\Jjv^/\1 v^-rVrV^ 1 1 WV\^-/t.1 wt.L ^rtrtu ^^-v^.^-vv^^-vri.'ci o x x 


2363 




| | | | | | | | M | | | | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 II 1 1 1 1 1 1 1 1 




Db 


481 


GGT GGAGGGCGACGGGCAGAGCTTCAGCATCAACTT CAACATCACCAAGGACACAAGGTT 


540 


Qy 




t r* r*w r* a r r* r n c r"P r n rT r*T c* c a c a rzT c a A cc ^^nfzrcTPPPA^PPPTGGTGfcfJPPPPAGTGP 


2423 




I I I 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


541 


TGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGC 


600 


Qy 


O AO A 


rTTraara'prrrrTTr'rTrnTTr^rArzAAfZATAATTTrr'A^rrTmArrf'ArrrTfiTAG 


2483 




| | | I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


601 


CTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTGGACCCACCCTGTAG 


660 


Qy 


O A Q /I 


rrrrrrn i rrrrarTrrrrr , ar r rrTr:r:r'r , racaAArTr , r"Arr , T^ArArirrATrTf"AfirTT 


2543 




| I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 M 




Db 


661 


GCGGGGT GCC GACT GGCGGACT CT GGCCCAGAAACT CC AC CT GGACAGC CAT CT CAGCTT 


720 


Qy 




rTTTrrrTrrAAnrrrAf^rrrrArA^rrATGATrrTrAArrTGTGGGAGGCGCGGCACTT 


2603 




I | | | | | | | || 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 1 M 1 




Db 


721 


CTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGAGGCGCGGCACTT 


780 


yy 




PPPP A APGGP A APPTPAGPPAGPTGGCTGCAGCAGTGGCTGGACTGGGCCAGCCAGACGC 


2663 




1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
M 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I i i i i i 




Db 


781 


CCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAGCCAGACGC 


840 


Qy 


2664 


TGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2697 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


841 


TGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 874 
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AK018177 3866 bp mRNA linear HTC 03-APR-2004 

Mus musculus adult male medulla oblongata cDNA, RIKEN full-length 
enriched library, clone: 63304 15E02 product : TRANSMEMBRANE RECEPTOR 
UNC5H2 homolog [Rattus norvegicus], full insert sequence. 
AK018177 

AK018177.1 GI: 12857775 
HTC; CAP trapper. 
Mus' musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Rodentia; 
1 

Carninci,P. and Hayashizaki, Y. 

High-efficiency full-length cDNA cloning 

Meth. Enzymol. 303, 19-44 (1999) 

99279253 

10349636 

2 

Carninci,P., Shibata,Y., Hayatsu,N., Sugahara,Y., Shibata,K., 

Itoh,M., Konno,H., Okazaki,Y., Muramatsu,M.. and Hayashizaki, Y. 

Normalization and subtraction of cap-trapper-selected cDNAs to 

prepare full-length cDNA libraries for rapid discovery of new genes 

Genome Res. 10 (10), 1617-1630 (2000) 

20499374 

11042159 
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Shibata,K., Itoh,M., Aizawa,K., 
Konno,H., Akiyama,J., Nishi,K., 
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Yamamoto, R 
Fujiwake, S 

Yoneda,Y., Ishikawa,T., Ozawa,K., Tanaka,T., Matsuura,S., Kawai, J. , 

Okazaki,Y., Muramatsu,M. , Inoue,Y., Kira,A. and Hayashizaki, Y. 

RIKEN integrated sequence analysis (RISA) system — 384-format 

sequencing pipeline with 384 multicapillary sequencer 

Genome Res. 10 (11), 1757-1771 (2000) 

20530913 

11076861 

4 

The RIKEN Genome Exploration Research Group Phase II Team and the 
FANTOM Consortium. 

Functional annotation of a full-length mouse cDNA collection 

Nature 409, 685-690 (2001) 

5 

The FANTOM Consortium and the RIKEN Genome Exploration Research 
Group Phase I & II Team. 

Analysis of the mouse transcriptome based on functional annotation 
of 60,770 full-length cDNAs 
Nature 420, 563-573 (2002) 
6 (bases 1 to 3866) 

Adachi,J., Aizawa,K., Akahira,S., Akimura,T., Arai,A. , Aono,H., 
Arakawa,T., Bono,H., Carninci,P., Fukuda,S., Fukunishi, Y. , 
Furuno,M., Hanagaki,T., Hara,A. , Hayatsu,N., Hiramoto,K., 
Hiraoka,T., Hori,F., Imotani,K., Ishii,Y., Itoh,M., Izawa,M. , 
Kasukawa,T., Kato,H., Kawai,J., Kojima,Y., Konno,H., Kouda,M., 
Koya,S., Kurihara,C, Matsuyama, T . , Miyazaki,A., Nishi,K. , 
Nomura, K., Numazaki,R., Ohno,M., Okazaki,Y., Okido,T., Owa,C, 



Nagaoka,S., Sasaki, N., 
Kitsunai, T . , Tashiro, H 
Hazama,M., Nishine,T., 
Matsumoto,H. , Sakaguchi, S . , Ikegami,T., Kashiwagi,K 
Inoue,K., Togawa,Y., Izawa,M., Ohara,E., Watahiki,M 



Carninci, P. 
, Itoh,M., 
Harada,A. , 



Saito,H., Saito,R., Sakai,C, Sakai,K., Sano,H., Sasaki, D., 
Shibata,K., Shibata,Y., Shinagawa,A. , Shiraki,T., Sogabe,Y., 
Suzuki, H . , Tagami,M., Tagawa,A., Takahashi, F. , Tanaka,T., 
Tejima,Y., Toya,T., Yamamura, T . , Yasunishi,A. , Yoshida,K., 
Yoshino,M., Muramatsu,M. and Hayashizaki, Y. 
TITLE Direct Submission 

JOURNAL Submitted ( 10- JUL-2000 ) Yoshihide Hayashizaki, The Institute of 
Physical and Chemical Research (RIKEN) , Laboratory for Genome 
Exploration Research Group, RIKEN Genomic Sciences Center (GSC) , 
RIKEN Yokohama Institute; 1-7-22 Suehiro-cho, Tsurumi-ku, Yokohama, 
Kanagawa 230-0045, Japan (E-mail : genome-resSgsc . riken . jp, 
URL: http://genome.gsc. riken.jp/, Tel : 81-45-503-9222, 
Fax:81-45-503-9216) 

COMMENT Please visit our web site (http://genome.gsc.riken.jp/) for further 

details . 

cDNA library was prepared and sequenced in Mouse Genome 
Encyclopedia Project of Genome Exploration Research Group in Riken 
Genomic Sciences Center and Genome Science Laboratory in RIKEN. 
Division of Experimental Animal Research in Riken contributed to 
prepare mouse tissues. First strand cDNA was primed with a primer 
[5' GAGAGAGAGAAGGATCCAAGAGCTCTTTTTTTTTTTTTTTTVN 3»], cDNA was 
prepared by using trehalose thermo-activated reverse transcriptase 
and subsequently enriched for full-length by cap-trapper. cDNA went 
through one round of normalization to Rot = 10.0 and subtraction to 
Rot = 100.0. Second strand cDNA was prepared with the primer 
adapter of sequence [5* 

GAGAGAGAGATTCT C GAGTTAATTAAATTAAT CCCCCCC CCCCC C 3']- cDNA was cleaved 
with BamHI and Xhol . Vector: a modified pBluescript KS(-I-) after 
bulk excision from Lambda FLC I. Cloning sites, 5* end: Sail; 3* 
end: BamHI. Host: DH10B. 
FEATURES Location/Qualifiers 
source 1. .3866 

/organism="Mus musculus" 

/mol_type="mRNA" 

/strain="C57BL/6J" 

/db_xref="FANTOM_DB: 63304 15E02" 

/db_xref ="taxon: 10090" 

/clone="6330415E02" 

/sex="male" 

/tissue_type="medulla oblongata" 

/clone_lib=" RIKEN full-length enriched mouse cDNA library" 
/ de v_s t a ge= " adul t " 
CDS 417. .3254 

/note="unnamed protein product; TRANSMEMBRANE RECEPTOR 

UNC5H2 homolog [Rattus norvegicus] ( SPTR | 008722, evidence: 

FASTY, 96.5%ID, 100%length, match=2835) 

putative" 

/codon_start=l 

/protein_id="BAB31108.1" 

/db_xref="GI : 12857776" 

/trans la tion="MRARSGVT^SALLLALLLCWDPTPSI^GvT)SAGQvTjPDSYPSAPA 
EQLPYFLLEPQDAYIVKNKPVELHCRAFPATQIYFKCNGEWVSQNDHVTQESLDEATG 
LRVREVQIEVSRQQVEELFGLEDYWCQCVAWSSSGTTKSRRAYIRIAYLRKNFDQEPL 
AKEVPLDHEVLLQCRPPEGVPVAEVEWLKNEDVIDPAQDTNFLLTIDHNLIIRQARLS 
DTANYTCVAKNIVAKRRSTAATVIVYWGGWSSWAEWSPCSNRCGRGWQKRTRTCTNP 
APLNGGAFCEGQAFQKTACTTVCPVT)GAWTEWSKWSACSTECAHWRSRECMAPPPQNG 
GRDCSGTLLDSKNCTDGLCVLNQRTLNDPKSHPLETSGDVALYAGLWAVFVWAVLM 



AEGVIVYRRNCRDFDTDITDSSAALTGGFHPVNFKTARPNNPQLLHPSAPPDLTASAG 
IYRGPVYALQDSADKIPMTNSPLLDPLPSLKIKVYNSSTIGSGSGLADGADLLGVLPP 
GTYPGDFSRDTHFLHLRSASLGSQHLLGLPRDPSSSVSGTFGCLGGRLSLPGTGVSLL 
VPNGAIPQGKFYDLYLHINKAESTLPLSEGSQTVLSPSVTCGPTGLLLCRPVVLTVPH 
CAEVIAGDWIFQLKTQAHQGHWEEWTLDEETLNTPCYCQLEAKSCHILLDQLGSYVF 
MGE S YS RS AVKRLQLAI FAPALCT S LE YS LRVYCLEDT PVALKEVLELERTLGGYLVE 
EPKPLLFKDSYHNLRLSLHDIPHAHWRSKLLAKYQEIPFYHVWNGSQRALHCTFTLER 
HSLASTEFTCKVCVRQVEGEGQIFQLHTTLAETPAGSLDALCSAPGNAITTQLGPYAF 
KIPLSIRQKICSSLDAPDSRGNDWRLLAQKLSMDRYLNYFATKASPTGVILDLWEARQ 
QDDGDLNSLASALEEMGKSEMLVAMATDGDC" 

ORIGIN 

Query Match 32.3%; Score 871.4; DB 3; Length 3866; 

Best Local Similarity 60.6%; Pred. No. 1.9e-175; 

Matches 1645; Conservative 0; Mismatches 941; Indels 129; Gaps 8; 



Qy 112 GC CAACCCGGAC CT GCTT C CCCACTT C CT GGT GGAGC CCGAGGAT GT GT ACAT C GT CAAG 171 

III I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 540 GCCCCTGCGGAGCAGCTGCCGTACTTCCTATTGGAGCCACAGGACGCCTACATCGTAAAG 599 

Qy 172 AACAAGCCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGC 231 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 600 AACAAGCCAGT GGAACT GCACT GC AGAGC CT T C CCT GCC ACGCAGAT CT ACTT CAAGT GT 659 

Qy 232 AACGGGGAGTGGGT GCGCCAGGTGGACCACGT GAT CGAGCGCAGCACAGACGGGAGCAGT 291 

I I I I I I I I I I I I I I I I I I I I I I I I I I II III I I I I II 

Db 660 AATGGC GAGT GGGT CAGCCAGAAT GACCACGT C ACACAGGAGAGC CT GGAT GAGGC CACA 719 

Qy 292 GGGCT GCCCACC AT GGAGGT C CGCATTAAT GT CT CAAGGCAGCAGGT CGAGAAGGT GT T C 351 

II III I I I I I I II I I I I I I I I I I I I I I I I I I I I I II 

Db 720 GGCTTGCGGGTGCGAGAGGTGCAGATCGAGGTGTCACGGCAGCAAGTGGAGGAACTCTTC 779 

Qy 352 GGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGT 411 

I I II I I I I I I I I I I I I I I I II I I I I I I I I I I II I I II I I I I M II I I I II I I I I 
Db 780 GGGCTCGAGGACTACTGGTGCCAGTGCGTGGCCTGGAGCTCTTCGGGAACTACCAAGAGT 839 

Qy 412 CAGAAGGCCT ACAT C CGCATAGCCAGATT GC GCAAGAACTT CGAGCAGGAGCCGCT GGCC 471 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I II I I I I I I I I 

Db 840 CGCCGAGCCTACATCCGCATTGCCTACTTGCGCAAGAACTTTGACCAGGAGCCTCTGGCC 899 

Qy 472 AAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCT 531 

I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I II 
Db 900 AAGGAGGTACCCTT GGAT CAT GAGGTCCTTCTGCAGT GCC GCCCACCGGAGGGAGTGCCT 959 

Qy 532 CCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAAT 591 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 960 GT GGCT GAGGT GGAAT GGCT CAAGAAT GAAGATGT CATT GACCC CGCT CAGGACACTAAC 1019 

Qy 592 GTATACATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCC 651 

I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1020 TT CCT GCTCACCATT GACCACAACCT CAT CAT CCGC CAGGC GC GCCT CT CAGAC ACGGCC 1079 

Qy 652 AACTACACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTC 711 

I I I III III II II III I I I III III I III I Mill III II I II I I I I 

Db 1080 AACTACACCTGTGTGGCCAAGAATATCGTGGCCAAGCGCCGGAGCACCGCGGCCACAGTC 1139 



Qy 712 AT C GTCT AC GT GAAC GGT GGGT GGT C GAC GT GGACCGAGTGGT C CGT CT GC AGC GCC AGC 771 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 I 1 1 1 I 1 1 1 1 1 II I III I II 

Db 1140 AT CGTCT AT GT GAAT GGAGGCT G GT C CAGCT GGGCAGAGT GGT CAC C CT GTT C CAATC GC 1199 

Qy 772 TGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGG 831 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1200 TGT GGCC GAGGCT GGCAGAAGC GT ACT C GGACCT GC AC CAAT C C AGC C C CACT CAAT GGA 1259 

Qy 832 GGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTA 891 

I I I I I I I I I I I I I I I I III I I I I I I I I I I I I III I I I I I I I I I I I I I I I 

Db 1260 GGCGCCTTCTGTGAGGGACAGGCCTTCCAGAAGACAGCTTGCACCACCGTGTGCCCAGTG 1319 

Qy 892 GACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGG 951 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1320 GAT GGAGCGT GGAC CGAGT GGAGCAAGT GGT CT GCCT GCAGCAC AGAGT GT GC GCACT GG 1379 

Qy 952 CGGAGCCGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACT 1011 

I I I I II I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I 

Db 1380 CGCAGCCGCGAGTGCATGGCACCGCCACCCCAGAACGGAGGCCGTGACTGCAGCGGGACG 1439 

Qy 1012 GACCT GGAC ACC CGCAACT GT AC CAGT GACCT CT GT GT ACACAGT GCTT CT GGCC 1066 

I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 144 0 CT ACTT GACT CCAAGAACT GCACT GAT GGGCTGT GCGTGCT GAAT CAGAGAACT CTAAAC 1499 

Qy 1067 CTGAGGACGTGGCCCTCTATGTGGGCCTCATC 1098 

I I I I I I I I I I I I I I I I I I I I 
Db 1500 GACCCTAAAAGC C AC CCC CT GGAGACAT CGGGAGAT GT GGCACT GT ACGC AGGCCT TGT G 1559 

Qy 1099 GCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTC CTCATCCTCGTTTATTGCCGG 1155 

I I I I I I I I I I I I I I I I I MINI I I 

Db 1560 GTGGCCGTCTTTGTGGTGGTAGCGGTTCTCATGGCCGAGGGAGTGATCGTATACCGGAGA 1619 

Qy 1156 AAGAAGGAGGGGCT GGACT CAGAT GT GGCT GACT CGT CCATTCTCACCTCAGGCTTC 1212 

II II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1620 AACTGCCGGGACTTCGACACGGACATCACCGACTCCTCTGCGGCCCTCACTGGTGGCTTC 1679 

Qy 1213 CAGCCCGT CAGCAT CAAGCC CAGCAAAGCAGACAACCCC CAT CTGCT CACCATC 1266 

I 1 I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1680 CACCCT GT CAACTT CAAGACT GCAAGGCCCAACAAC C C GCAGCT C CTGCAC C CGT CC GCC 1739 

Qy 1267 CAGCCGGACCT CAGC ACCAC CAC C ACCACCT AC CAGGGCAGT CTCT GT C C C CGGCAGGA- 1325 

I | | I I I I I I III I I I I I I I I II I I I I I I I I I I I I I 
Db 1740 CCTCCAGACCTAACGGCCAGTGCTGGCATCTACCGCGGGCCTGTGTATGCCCTGCAGGAC 1799 

Qy 1326 TGGGCCCAGCCCCAAG 1341 

I I I I I I I I I I I I 

Db 1800 T CCGC C GACAAGAT C CC CAT GACTAAT T CGC CCCT GCT GGAT C CC CTGC CC AGCCT CAAG 1859 

Qy 1342 TT C CAGCT CAC CAAT GGGCACCT GCT CAG C 1371 

I I I I I I I I I I I I I 

Db 1860 ATCAAGGTCTATAACTCCAGCACCATCGGTTCTGGGTCTGGCCTGGCTGATGGAGCCGAC 1919 

Qy 1372 CCC CT GGGT GGC GGC CGC CACAC ACT GCAC CACAGCT CT C CCACCT CT GAGGCCGAGGAG 1431 

I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1920 CTGCTGGGTGTCCTCCCGCCGGGCACGTACCCAGGCGATTTCTCCCGGGACACCCATTTC 1979 

Qy 1432 TTCGTCTCCCGCCTCTCCACCC AGAACTACTTCCGCTCCCTGCCCCGAGGCACC 1485 

I I III I I I I I I I I I I I I I I I I I I I I I I 



Db 1980 CTGCACCTGCGCAGTGCCAGCCTTGGTTCCCAGCACCTCCTGGGCCTACCTCGGGACCCC 2039 



Qy 1486 AGCAACAT GACCT AT GGGACCTT CAACTT CCT C GGGGGC C GGCTGATGATC C CTAAT ACA 1545 

I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 2040 AGCAGCAGTGTCAGCGGCACCTTTGGTTGCCTGGGAGGAAGGCTGAGCCTCCCCGGCACA 2099 

Qy 1546 GGT AT CAGCCT CCT C AT CC C CC C AGAT GC C AT AC CC CGAGGGAAGATCT AT GAGATCT AC 1605 

II I I I I I I I I III I I I II I I I I I 111111111111 III 

Db 2100 GGGGT CAGCCT GTT GGT ACCAAAT GGAGC C ATT C CC CAGGGCAAGTTCT AT GAC CT GT AT 2159 

Qy 1606 CTCACGCTGCACAAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTG 1665 

II I I I I II I I I I I I I I I I I I I I I I I I I 

Db 2160 CT ACAT AT CAACAAGGCCGAAAGCAC CCT C C CACTT T CAGAAGGT T CCCAGACAGT AT T G 2219 

Qy 1666 AGTCCCATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCT 1725 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2220 AGCCCCTCGGTGACCTGTGGGCCCACAGGCCTACTCCTGTGCCGCCCTGTCGTCCTCACC 2279 

Qy 1726 ATGGACCACTGTGGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCG 1785 

II I II I I I I I II I I I I I I I I I I I I I I I I I II I I I I I 

Db 2280 GT GCCCCACT GT GCT GAAGT CAT CGCT GGAGACT GGAT CTTT CAGCTCAAGACCCAGGCC 2339 

Qy 17 86 TGCGAGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTAC 1845 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2340 CAT CAGGGCC ACT GGGAGGAGGT GGT GACCT TGGAT GAGGAGACCCTCAACACACCCT GC 2399 

Qy 1846 TACTGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCC 1905 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2400 TACTGCCAGCTGGAGGCTAAGTCCTGCCACATCCTGCTGGACCAGCTGGGTTCCTACGTA 2459 

Qy 1906 CTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCG 1965 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2460 TTCATGGGCGAGTCCTACTCTCGCTCTGCAGTCAAGCGGCTCCAGCTGGCCATCTTCGCC 2519 

Qy 1966 CCGGTGGCCTGCACCTCCCTCGAGTACAACATCCGGGTCTACTGCCTGCATGACACCCAC 2025 

II I I II II II I I II I I I I I I I I II I II I I I I I I I III I I I I I I I 

Db 2520 CCAGCCCT CTGCACCTCC CTGGAGT AT AGC CTCAGGGTCT ACT GT CTGGAGGACACAC CT 2579 

Qy 2026 GAT GCACT CAAGGAGGT GGT GC AGCT GGAGAAGCAGCT GGGGGGACAGCTGAT CCAGGAG 2085 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I II I 

Db 2580 GTAGCACT GAAGGAGGTCCTGGAGCT GGAGAGGACT CTGGGTGGCTACTTGGTGGAGGAG 2639 

Qy 2086 CCACGGGT CCT GCACTT CAAGGACAGTT ACCACAAC CT GC GC CT AT CCATC CACGAT GT G 2145 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2640 CCCAAGCCTTTGCTCTTTAAGGACAGTTACCACAACCTACGCCTCTCCCTCCATGACATC 2699 

Qy 2146 CC C AGCTC CCT GT GGAAGAGTAAGCT C CT T GT C AGCT AC C AGGAGATC C CCT T TT AT C AC 2205 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 2700 CC C CAT GCC CACTGGAGGAGCAAACT ACT GGC CAAGT ACCAGGAGATT CC CTT CT AC C AC 2759 

Qy 2206 ATCTGGAATGGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCC 2265 

I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 2760 GT CT GGAAT GG C AGC CAGAGAGCCCT GCACT GCACTTT CACC CT GGAGAGGCAT AGCCT G 2819 

Qy 2266 AGCACTAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGC 2325 

III II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2820 GCCTCCACGGAGTTCACCTGTAAGGTCTGCGTGCGGCAGGTCGAAGGGGAAGGCCAGATT 2879 



Qy 2326 TT CAGCAT CAACTT CAACAT C ACC AAGGACACAAGGTTTGCTGAGCTGCTGGCTCTG 2382 

III I I I I I I I I I III II II 

Db 2880 TTCCAGCTGCACACAACGTTGGCCGAGACGCCTGCTGGCTCCCTGGATGCTCTCTGCTCT 2939 

Qy 2383 GAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTC 2442 

I I I III I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 2940 GCCCCGGGCAATGCCATCACCACCCAGCTGGGACCCTATGCCTTCAAGATACCCCTGTCC 2999 

Qy 2443 ATTCGGCAGAAGATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGG 2502 

_.U I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 3000 AT C CGCCAAAAGATCT GCAGCAGCCT GGAC GC CC C CGACT C CCGGGGCAACGACT GGAGG 3059 

Qy 2503 ACTCTGGCCCAGAAACTCCACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGC 2562 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 3060 CTGTTGGCGCAGAAGCTGTCCATGGACCGGTACCTAAACTACTTCGCCACCAAAGCTAGT 3119 

Qy 2563 CCCACAGCCATGATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGC 2622 

I I I I I I I I I I I I I I I I I I I I I I I Ml I I I I I I I I I I I I I 

Db 3120 C CCACAGGT GT C AT CT TAGACCT CT GGGAAGCT CGGCAACAGGAT GACGGGGACCT CAAC 3179 

Qy 2623 CAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCG 2682 

I I I I I MINI I I I I I I I II I III I 

Db 3180 AGCCTGGCCAGTGCCTTGGAGGAGAT GGGCAAGAGTGAGAT GCTGGTAGCCAT GGCCACA 3239 

Qy 2683 GAGGCT GAGT GCT GA 2697 

III I I I I I I I I 
Db 324 0 GATGGCGATTGCTGA 3254 
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TITLE 



AY406492 ' 2802 bp DNA linear GSS 15-DEC-2003 

Pan troglodytes UNC5C gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY406492 

AY406492.1 GI: 39762466 
GSS. 

Pan troglodytes (chimpanzee) 
Pan troglodytes 
Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 

1 (bases 1 to 2802) 

Clark, A. G., Glanowski, S . , Nielson,R., Thomas, P., Kejariwal, A. , 
Todd, M. A., Tanenbaum, P.M. , Civello, D. R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J . J . , 
Adams, M.D. and Cargill,M. 

Inferring nonneutral evolution from human- chimp -mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 

2 (bases 1 to 2802) 

Clark, A. G., Glanowski, S . , Nielson,R., Thomas, P., Ke j ariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D. R., Lu,F., Murphy, B. , 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 
Direct Submission 



JOURNAL Submitted ( 16-NOV-2003) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 
COMMENT This sequence was made by sequencing genomic exons and ordering 

them based on alignment. 
FEATURES Location/Qualifiers 
source 1- .2802 

/organism="Pan troglodytes" 
/mol__type= "genomic DNA" 
/db_xref="taxon:9598" 
gene <1 . .>2802 

/gene="UNC5C" 

/ locus_tag= "HCM2 575" 

ORIGIN 

Query Match 30.2%; Score 814; DB 9; Length 2802; 

Best Local Similarity 53.8%; Pred. No. 3.4e-163; 

Matches 1477; Conservative 0; Mismatches 1200; Indels 69; Gaps 6; 

Qy 12 GCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGG 71 

| | I I I I I I I I I I II I I M I II I I Ml I 

D b 66 GCTCGTGCTACCTGCCCTGGCCCTGCTCAGCGCCAGCGGCACTGGCTCCGCCGCCCAAGA 125 

Qy 72 TGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCC 131 

| | | | I I I I II II I II II 

Db 126 T GAT GACTTTTT T CAT GAACT CCCAGAAACTT T T C CTT C GGAT CCACCT GAGC CT CTGC C 185 

Qy 132 CCACTTC CT GGT GGAGCCCGAGGAT GT GTAC AT CGT CAAGAACAAGCC AGT GCTGCTT GT 191 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I M 

Db 186 ACATTTC CTT ATT GAACCT GAGGAAGCTTAT AT T GT GAAGAATAAGCCT GT GAAC CTGT A 245 

Qy 192 GTGCAAGGCC GTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGT 245 

II II II I 

Db 246 CTGTAAAGCAAGCCCTGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 305 

Q y 246 GCGCCAGGTGGACCACGT GAT CGAGCGCAGCACAGACGGGAGCAGT GGGCTGCCCACCAT 305 

D b 306 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 365 

Qy 306 GGAGGT CCGCATTAAT GT CT CAAGGCAGCAGGT C GAGAAGGT GTT CGGGCT GGAGGAAT A 365 

Db 366 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 425 

Qy 366 CT GGT GCCAGT GCGT GGCAT GGAGCT CCTC GGGCACCAC CAAGAGT CAGAAGGC CT ACAT 425 

Db 426 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 4 85 

Qy 426 CCGCAT AGCCAGATT GC GCAAGAACTT CGAGCAGGAGCC GCT GGC CAAGGAGGT GT C C CT 485 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 486 NNNNNNNNNNNNNNNNC GGAAGACATT T GAGCAGGAACC CCT AGGAAAGGAAGT GT CTTT 545 

Qy 486 GGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGA 545 

I I I I I I I II I II I I I I I I I I I Ml 

Db 546 GGAACAGGAAGT CTT ACT CC AGT GT C GGCC ACCT GAAGGGAT C CC AGT GGCT GAGNNNNN 605 

Qy 546 GT GGCT CC GGAACGAGGACCT GGT GGAC C C GT C CCT GGACCC CAAT GT AT ACAT CAC GCG 605 

Mill I II I III I II II II 

Db 606 NNNNNNGAAAAATGAAGACATAATTGAT CCCGTT GAAGATCGGAATTTTT ATATTACTAT 665 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 



606 



666 



666 



726 



726 



786 



786 



846 



846 



906 



906 



966 



966 



GGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGT 665 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I- I I 

TGATCACAACCT C ATCATAAAGCAGGCCCGACT CT CT GAT ACT GCAAAT TAT AC CT GT GT 725 

GGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAA 725 

I I I I I II I I I I I I I I II I III I I I I I I.I I I I I I I I I I 

TGC CAAAAACATT GTT GC CAAGAGGAAAAGT ACAACT GCCACTGT C AT AGT CT AT GTCAA 785 

CGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTG 785 
I I I I I I I I I I I II I I I I I I I I I I I I I U N I I I I I I I I I I II II I 
CGGTGGCTGGTCCACCTGGACGGAGTGGTCTGTGTGTAACAGCCGCTGTGGACGAGGGTA 845 

GCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGA 845 

I I I I I I I I I III II I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I 
TCAGAAACGT ACAAGGACTT GTAC CAACCC GGCAC CACT CAATGGGGGT GC CTT CT GT GA 905 

GGGGC AGAAT GT CCAGAAAACAGC CTGC GCCACC CT GT GCCC AGT AGAC GGCAGCT GGAG 905 

I I I I I I I III I I I I II I I I I I II I II I I I I I I I I I II I I I I I I I I I 
AGGGCAGAGT GT GC AGAAAAT AGC CTGTACT ACGTT AT GC CCAGT GGAT GGC AGGT GGAC 965 

CCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTG 965 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GCCAT GGAGCAAGT GGT CT ACTT GT GGAACT GAGT GC AC C C ACT GGCGC AGGAGGGAGT G 1025 



CT CT GACCCAGCACCC CGCAACGGAGGGGAGGAGT GC CAGGGCACT GAC CT GGAC AC CC G 1025 
III I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II 
1026 CACGGC GCCAGCCCCCAAGAAT GGAGGCAAGGACT GC GATGGCCT CGT CTT GCAAT CCAA 1085 

1026 CAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTA 1085 

I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
1086 GAACTGCACT GAT GGGCTTT GC AT GCAGACT GCT C CT GATT C AGAT GAT GTT GCT CT CT A 1145 

108 6 TGTGGG CCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCT 1142 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I 

1146 TGTTGGGATTGTGATAGCAGTGATCGTTTGCCTGGCGATCTCTGTAGTTGTGGCCTTGTT 1205 

1143 CGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCAC 1202 

I I I I I I III I I I I I I I I I I I I II I I I I I I I I I I 

1206 T GT GT AT CGGAAGAAT CAT C GT GACTT T GAGT CAGAT AT TATT GACTCT T C GGCACT CAA 1265 

1203 CT CAGGCTT CCAGC CC GT C AGCAT CAAGCC CAGCAAAGCAGACAAC C CC C AT CTGCT CAC 1262 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1266 TGGGGGCTT T CAGC CT GT GAACATCAAG GCAGCAAGACAAGATCTGCTGGC 1316 

1263 CAT C CAGCCGGACCTC AGCAC CAC CAC CAC CACCT AC CAGGGC AGT CT CTGT C CC CGGC A 1322 
II I I I I I I I I I I I I III III II I II I I I I I I II 
TGT ACC C CCAGACCTCAC GT C AGCT GCAGC CAT GT ACAGAGGACCT GT CTAT GCCCT GC A 1376 



1317 



1323 GGATG GGCC CAGC C C CAAGT TCCAGCT CAC CAAT GGGCACCTGCTCAGCCC 1373 

III II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1377 TGACGT CT CAGACAAAAT C C CAAT GAC CAACT CT C CAATT CT GGAT CC ACT GC CCAAC CT 1436 

1374 CCTGGGT GGC GGCC GCCACACACTGCAC CAC AGCT CTCCCACCTCTGAGGCCGAGGAGTT 1433 

I I I I I I I I I I I III I I I I I I 

1437 GAAAAT CAAAGTGT AC AACACCT C AGGT GCT GT C ACC CCCCAAGAT GAC CT CT CT GAGTT 1496 



Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 



1434 CGTCTCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACAT 14 93 

III I I I I I I I I I I I I II I I I I I I I 

1497 TAC GT CCAAGCT GT C CC CT C AGAT GAC CC AGT C ATT GTT GGAGAAT GAAGC C CT C AGCCT 1556 



1494 GA 



1511 



1557 



1512 



CCTATGGGACCTTCAA 

II I I I I I I I II I 

GAAGAACCAGAGT CTAGCAAGGCAGACT GAT C CATC CT GT AC C GC AT T T GGCAGCT T CNN 1616 



CTT CCT CGGGGGCCGGCT GAT GAT CC CT AM 1 ACAGGT AT CAGC CT C CT CAT CCC C C CAGA 1571 

I I I I I I I I I I I I I. I I I I I I I I I I I I I I I I I I I I I I 

1617 NTNGCTGGGNNNNCACCTTATTGTTCCCAATTCAGGAGTCAGCTTGCTGATTCCCGCTGG 1676 

1572 TGCCATACCCCGAGGGAAGAT CTAT GAGAT CT ACCT CAC GCT GCACAAGCC GGAAGAC GT 1631 

I I I I I I I I I I I I I I I I II I I I I I I III I I I I I I III I 
1677 GGC CAT TCCCCAAGGGAGAGT CT AC GAAAT GTAT GT GACT GT ACAC AGGAAAGAAACT AT 1736 

.1632 GAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCC 1691 

I I I I I I I I I I I I I I I I I I I I I III II I I I I I I I I II I I I I I I 
1737 GAGGCCACCCATGGATGACTCTCAGACACTTTTGACCCCTGTGGTGAGCTGTGGGCCCCC 1796 

1692 TGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCC 1751 

III I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
1797 AGGAGCTCTGCTCACCCGCCCCGTCGTCCTTACTATGCATCACTGCGCAGACCCCAATAC 1856 

1752 TGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCT 1811 

II I I I I I II I I I II I I I I I I MM I I I II II II II I I 
1857 CGAGGACT GGAAAAT ACT GCT CAAGAACCAGGCAGCACAGGGACAGTGGGAGGAT GT GGT 1916 

1812 GCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTG 1871 

I I I I I I I II III II I I I II I II I II II I II II II I 

1917 GGT GGT CGGGGAGGAAAACTT CACCACC CC CTGCT ACAT T CAGCT GGAT GCAGAGGCCT G 1976 

1872 CTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGC 1931 

I I I I I II I I II I I I I II II I I I I I I II II I I II III II 
1977 CCACAT CCTCACAGAGAACCTCAGCACCTACGCCCT GGTAGGACATTCCACCACCAAAGC 2036 

1932 TGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTA 1991 

II I I I II I II II I I I II I I I II I I I II II I II I I II I I I I I I I I 

2037 GGCTGCGAAGCGCCTCAAGCTGGCCATCTTTGGGCCCCTGTGCTGCTCCTCGCTGGAGTA 2096 



1992 



2051 



CAACAT CCGGGT CT ACT GC CT GCAT GACACCCACGAT GCACT CAAGGAGGT GGT GCAGCT 
II I II II I I II II I I I III II II II I I I I II I II II Mill I I II II 
2097 CAGCAT CCGAGT CT ACT GT CT GGAT GACACCCAGGAT GCC CT GAAGGAAATT TT ACAT CT 2156 



2052 



2111 



GGAGAAGCAGCT GGGGGGACAGCT GAT C CAGGAGC CACGGGT C CT GCACTT CAAGGACAG 
I I I I I II I I I I I I I I I I I I I I I I II II I I II II II I I I I 
2157 TGAGAGACAGAT GGGAGGAC AGCT C CT AGAAGAACCTAAGGCT CT T CATTT TAAAGGCAG 2216 

2112 TT ACCACAACCT GCGCCT AT C CAT C CAC GAT GT GC CCAGCTCCCT GT GGAAGAGTAAGCT 2171 

I II I I I I I I I I II II II I I I II I II I II I I I M I I II I I I I I I I 
2217 CAC CCACAACCT GCGCCT GTCAATT CAC GAT AT CGCCCATTCCCTCTGGAAGAGCAAATT 2276 

2172 CCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCGGTACTT 2231 

I I I I II II I III 
2277 GCTGGCTAAATATCAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNAACCT 2336 

2232 GCACT GCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCT GGC CTGCAAGCT 2291 



Db 



2337 



I I I I I I I I I I I I I I I I I I I I I Mill I I I I I I I I I I I I II I I I 
GCACT GCAC CTT CACT CT GGAAAGAT TT AGCCT GAAC ACAGT GGAGCT G GTT TGCAAACT 



2396 



Qy 2292 GT GGGT GT GGCAGGT GGAGGGC GAC GGGC AGAGCT T C AGCAT CAACTT CAACAT C AC CAA 2351 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2397 CT GT GT GC GGCAGGT GGAAGGAGAAGGGCAGAT CTT CCAGCT CAACTGC AC C GT GT CAGA 2456 

Qy 2352 GGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGT 2411 

I I I I I I I I I I I I I I I I II I I I I I 

Db 2457 GGAACCTACTGGCATCGATTTGCCGCTGCTGGATCCTGCGAACACCATCACCACGGTCAC 2516 

Qy 2412 GGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTGGA 2471 

I I I- I I I I I I I I I I I I I I I I I III I I I I I I I I II I I I I I I I I I I I I 
Db 2517 GGGGCCCAGTGCTTTCAGCATCCCTCTCCCTATCCGGCAGAAGCTCTGTAGCAGCCTGGA 2576 

Qy 2472 CCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAG 2531 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2577 TGCCCCCCAGACGAGAGGCCATGACTGGAGGATGCTGGCCCATAAGCNNNNNNNNNNNNN 2636 

Qy 2532 CCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGA 2591 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2637 GTACTTGAATTACTTTGCCACCAAATCCAGCCCAACTGGCGTAATCCTGGATCTTTGGGA 2696 

Qy 2592 GGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGG 2651 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I 
Db 2697 AGCACAGAACTT CC CAGAT GGAAAC CT GAGC AT GCT GGCAGCT GT CTT GGAAGAAAT GGG 2756 

Qy 2652 CCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2697 

I I I I I III II I I I I II I I I 
Db 2757 AAGACATGAAACGGT GGT GT CCTT AGCAGCAGAAGGGCAGTATTAA 2802 
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Craniata; Vertebrata; Euteleostomi; 
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AY411747 2532 bp DNA linear GSS 12-DEC-2003 

Homo sapiens HCM4327 gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY411747 

AY411747.1 GI:39767715 
GSS. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 

1 (bases 1 to 2532) 

Clark, A. G., Glanowski, S . , Nielson,R., Thomas, P., Kejariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 

Inferring nonneutral evolution from human- chimp-mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 

2 (bases 1 to 2532) 

Clark, A. G. , Glanowski, S . , Nielson,R., Thomas, P., Kejariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D. R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 



Adams , M . D . and Cargill,M. 
TITLE Direct Submission 

JOURNAL Submitted ( 16-NOV-2003) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 
COMMENT This sequence was made by sequencing genomic exons and ordering 

them based on alignment. 
FEATURES Location/Qualifiers 
source 1. .2532 

/organism="Homo sapiens" 
/mol_type= M genomic DNA" 
/db_xref="taxon:9606" 
gene <1. .>2532 

/locus_tag="HCM4327" 

ORIGIN 

Query Match 30.0%; Score 810.4; DB 9; Length 2532; 

Best Local Similarity 61.1%; Pred. No. 2e-162; 

Matches 1540; Conservative 0; Mismatches 851; Indels 129; Gaps 9; 

Qy 307 GAGGTC CGC ATTAATGT CT CAAGGCAGCAGGT CGAGAAGGT GTT C GGGCT GGAGGAAT AC 366 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 13 GAGGTGCAGAT C GAGGT GT CGCGGCAGCAGGT GGAGGAGCT CTTT GGGCT GGAGGAT T AC 72 

Qy 367 TGGT GC CAGT GCGT GGCATGGAGCT CCT CGGGCACC AC CAAGAGT C AGAAGGCCT ACAT C 426 

I II I I I I I 1.1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 73 TGGTGCCAGT GCGT GGC CTGGAGCTCCGCGGGCACCAC CAAGAGT CGCCGAGCCT AC GTC 132 

Qy 427 CGCATAGCCAGATT GC GCAAGAACTTC GAGCAGGAGCC GCT GGC CAAGGAGGTGT CCCT G 486 

I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Mill 

Db 133 CGCATCGCCTACCTGCGCAAGAACTTCGATCAGGAGCCTCTGGGCAAGGAGGTGCCCCTG 192 

i 

Qy 487 GAGCAGGGCATCGT GCT GCCCTGCCGTCCACCGGAGGGCATC CCT CCAGCC GAGGT GGAG 546 

M ill I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 193 GACCATGAGGTTCTCCTGCAGTGCCGCCCGCCGGAGGGGGTGCCTGTGGCCGAGGTGGAA 252 

Qy 547 TGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATCACGCGG 606 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 253 TGGCTCAAGAAT GAGGAT GTCAT C GAC CCC ACCCAGGAC AC CAACTTC CT GCT CAC CAT C 312 

Qy 607 GAGCACAGCCT GGT GGT GCGACAGGCCC GC CTTGCTGACAC GGCCAACT ACAC CT GCGT G 666 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 313 GAC C ACAAC CT CAT CAT C CGC C AGGC C C GC CT GT C GGACACT GCCAACT AT AC CT G C GT G 372 

Qy 667 GCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAAC 726 

I I I I I I I I I I I I I I I I I I I I I I III II I II I I I I I I I I I I I I I I I I I I 

Db 373 GC CAAGAACAT CGT GGC CAAAC GC CGGAGCACCACTGCCAC C GT CATC GTCT ACGT GAAT 432 

Qy 727 GGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGG 786 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 433 GGCGGCTGGTCCAGCTGGGCAGAGTGGTCACCCTGCTCCAACCGCTGTGGCCGAGGCTGG 492 

Qy 787 CAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAG 846 

I I I I I II I I I I I I I I I I I I I I I I I I II II I I I I I I I I II II I I I I I III 

Db 493 CAGAAGCGCACC C GGAC CT GCAC CAAC CCCGCTC CACT CAACGGAGGGGCCTT CT GCGAG 552 

Qy 847 GGGCAGAAT GT C CAGAAAACAGC CT GC GCCACCCT GT GCCCAGT AGAC GGC AGCT GGAGC 906 

II III I I I I I I I II I I I I I I I I I I I I I I I I I I I I II II I I I I 



Db 



553 GGC CAGGCATT CCAGAAGACC GC CT GCACCAC CAT CT GC CCAGT C GAT GGGGCGT GGAC G 612 



Qy 907 CCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGC 966 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i ii ii 1 1 1 1 1 1 1 1 1 1 n 1 1 1 1 1 1 1 1 1 

Db 613 GAGTGGAGCAAGTGGTCAGCCTGCAGCACTGAGTGTGCCCACTGGCGTAGCCGCGAGTGC 672 

Qy 967 T CT GACCCAGCAC C C CGCAACGGAGGGGAGGAGT GC CAGGGCACT GACCT GGAC ACC CG C 1026 

I II I I I I I I I I I I I I I I I I I II I I II I I I I I I 

Db 673 ATGGCGCCCCCACCCCAGAACGGAGGCCGTGACTGCAGCGGGACGCTGCTCGACTCTAAG 732 

Qy 1027 AACT GT ACCAGT GAC CTCT GT GT ACACAGT GCTT CT 1062 

I I I I I I I II I I I I I I I I I 
Db 733 AACT GCAC AGATGGGCT GT GCAT GCAAAATAAGAAAACT CT AAGCGAC CCCAACAGCC AC 792 

Qy 1063 GGCCCTGAGGACGTGGCCCTCTATGTGGGCCTC ATCGCCGTGGCCGTC 1110 

I I I I I I I I I I I I I I I I I I I I I I I I II I I III 

Db 793 CTGCTGGAGGCCTCAGGGGATGCGGCGCTGTATGCGGGGCTCGTGGTGGCCATCTTCGTG 852 

Qy 1111 TGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTG 1170 

I I I I I I I I I II I I I I I I I I I I I I I I 

Db 853 GTCGTGGCAATCCTCATGGCGGTGGGGGTGGTGGTGTACCGCCGCAACTGCCGTGACTTC 912 

Qy 1171 GACT CAGAT GT GGCTGACT CGT CCATT CTCACCTCAGGCTTCCAGCCCGTCAGCATC 1227 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 913 GACACAGACAT CACT GACT CAT CT GCT GCCCT GACT GGT GGTTT CC AC CC CGTCAACTTT 972 

Qy 1228 AAGCCCAGCAAAGCAGACAACCCCCAT CT GCT CACCATCCAGCCGGACCTCAGC 1281 

II I I I I I I I I I I I I I I I I II II I I I I II I I 

Db 973 AAGACGGCAAGGC CCAGCAACCCGCAGCT CCT ACACCC CT CTGT GCCT C CT GAC CT GACA 1032 

Qy 1282 ACCACCACCACCACCT ACCAGGGCAGT CT CTGT C C CCGGCAGGAT GGG 1329 

I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 1033 GCCAGCGCCGGCATCTACCGCGGACCCGTGTATGCCCTGCAGGACTCCACCGACAAAATC 1092 

Qy 1330 CCCAGCCCCAAGTTCCAGCTCACCA— 1354 

I I I I I I I I I I I I I I I I II 
Db 1093 CCCATGACCAACTCTCCTCTGCTGGACCCCTTACCCAGCCTTAAGGTCAAGGTCTACAGC 1152 

Qy 1355 ATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCC ACACA 1395 

MIN I I III II I I I II I I I 

Db 1153 TCCAGCACCACGGGCTCTGGGCCAGGCCTGGCAGATGGGGCTGACCTGCTGGGGGTCTTG 1212 

Qy 1396 CTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCCAG 1455 

III I I I I I I I I I I I I I I I I I I I I I I 

Db 1213 CCGCCTGGCACATACCCTAGCGATTTCGCCCGGGACACCCACTTCCTGCACCTGCGCAGC 1272 

Qy 1456 AACTACTTCCGCTC C CT GCC CCGAGGCAC C AGCAAC AT GACCT AT 1500 

I I I I I I I I I I I I I I I II I I I I I I I I 

Db 1273 GCCAGCCTCGGTTCCCAGCAGCTCTTGGGCCTGCCCCGAGACCCAGGGAGCAGCGTCAGC 1332 

Qy 1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1560 

I I I I I I I I I I I I I I I I I I I I I Mill I I I I I I I I I I I I I 

Db 1333 GGCACCTTTGGCTGCCTGGGTGGGAGGCTCAGCATCCCCGGCACAGGGGTCAGCTTGCTG 1392 

Qy 1561 AT CCCCC CAGAT GCCATAC C C C GAGGGAAGAT CT AT GAGAT CT AC CT CACGCT GCACAAG 1620 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 1393 GTGC CCAAT GGAGCCATT C C C CAGGGCAAGTT CT AC GAGAT GT ATCT ACTCATCAACAAG 1452 



Qy 1621 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1680 

I I I I II II II I I I I I I I I I I I I I I I I I 

Db 1453 GCAGAAAGT ACC CTC CCGCTT T CAGAAGGGAC C C AG AC AGT ATT GAGC C C CT CGGTGAC C 1512 

Qy 1681 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1740 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1513 T GT GGAC CCACAGGC CT C CT GCT GTGCCGCCCCGT CAT C CT C AC CAT GC C C C ACT GT GC C 1572 

Qy 1741 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1800 

II III I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 1573 GAAGTCAGTGCCCGTGACTGGATCTTTCAGCTCAAGACCCAGGCCCACCAGGGCCACTGG 1632 

Qy 1801 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1860 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I 

Db 1633 GAGGAGGTGGTGACCCTGGATGAGGAGACCCTGAACACACGCTGCTACTGCCAGCTGGAG 1692 

Qy 1861 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1920 

I I I I I I I I I Mill I I I I I I I I II I II I I I I I II I I I 

Db 1693 CCCAGGGCCTGTCACATCCTGCTGGACCAGCTGGGCACCTACGTGTTCACGGGCGAGTCC 1752 

Qy 1921 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 1980 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 1753 TATTCCCGCTCAGCAGTCAAGCGGCTCCAGCTGGCCGTCTTCGCCCCCGCCCTCTGCACC 1812 

Qy 1981 T CCCTCGAGTACAACAT CCGGGT CT ACT GCCT GC AT GACACC CACGAT GCACT CAAGGAG 2040 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 1813 TCCCTGGAGTACAGCCTCCGGGTCTACTGCCTGGAGGACACGCCTGTAGCACTGAAGGAG 1872 

Qy 2041 GTGGTGCAGCTGGAGAAGCAGCT GGGGGGACAGCT GAT CCAGGAGC CACGGGT C CT GCAC 2100 

I I I I I I I I I I I I I I I I I I I I I I I III I I I I II I II 

Db 1873 GTGCTGGAGCTGGAGCGGACTCTGGGCGGATACTTGGTGGAGGAGCCGAAACCGCTAATG 1932 

Qy 2101 TTCAAGGACAGTT ACCACAAC CT GCGCCT ATC CAT C CACGAT GT GC C C AGCT C C CT GT GG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II III I II I II I III III III 

Db 1933 TTCAAGGACAGTT AC CACAACCT GC GCCT CT CC CT C CAT GAC CT C C C CCAT GC C CATT GG 1992 

Qy 2161 AAGAGTAAGCTCCTT GT CAGCT AC C AGGAGAT C CC CTTTT AT CAC AT CT GGAAT GGCAC G 2220 

I III I I I I I II I II I I I I I I I II I I I I I I II II I I I I II I I I I I I I I I 

Db 1993 AGGAGCAAGCTGCTGGCCAAAT AC C AGGAGAT C C CCTT CTAT CAC AT T T GGAGT GGCAGC 2052 

Qy 2221 CAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTG 2280 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I 

Db 2053' CAGAAGGCCCTCCACTGCACTTT CACCCT GGAGAGGCACAGCTTGGCCTCCACAGAGCT C 2112 

Qy 2281 GCCT GCAAGCTGTGGGT GT GGCAGGT GGAGGGC GAC GGGCAGAGCTT CAGCAT CAACTT C 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I 

Db 2113 ACCT GCAAGATCT GC GT GCGGCAAGT GGAAGGGGAGGGCCAGAT ATT CCAGCT GCAT AC C 2172 

Qy 2341 AACATCACCAAG GACACAAGGTT T GCT GAGCT GCT GGCT CTGGAGAGT GAAGC GGGG 2397 

I I I I I III II II I II 

Db 2173 ACTCTGGCAGAGACACCTGCTGGCTCCCTGGACACTCTCTGCTCTGCCCCTGGCAGCACT 2232 

Qy 2398 GT C C CAGC CCTGGTGGGCCC C AGT GC CTT CAAGAT C CC CTT C CT CATT CGGC AGAAGAT A 2457 

II I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I II I 

Db 2233 GT CACC ACCCAGCT GGGAC CTT AT GCCT T CAAGAT C CCACT GT C CAT CC GCC AGAAGAT A 2292 



Qy 

Db 



2458 ATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAA 2517 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I 

2293 T GCAACAGCCTAGAT GCC C C CAACT CACGGGGCAAT GACT GGCGGAT GTT AGC AC AGAAG 2352 



Qy 2518 CTCCACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATC 2577 

III II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 2353 CTCT CT ATGGAC C GGT AC CT GAAT TACT T T GCCAC CAAAGC GAGC CC C AC GGGT GT GAT C 2412 

Qy 2578 CTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCA 2637 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II 

Db " 2413 CTGGACCTCTGGGAAGCTCTGCAGCAGGACGATGGGGACCTCAACAGCCTGGCGAGTGCC 2472 

Qy 2638 GTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2697 

I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 2473 TTGGAGGAGAT GGGCAAGAGT GAGAT GCT GGT GGCT GT GGCC AC C GAC GGGGACT GCT GA 2532 
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Length 2532; 
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Qy 



Db 



307 GAGGTCC GCATT AAT GTCT CAAGGCAGCAGGT CGAGAAGGT GTT C GGGCT GGAGGAAT AC 
I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II 
1 3 GAGGTGC AGAT CGAGGTGT CACGGCAGCAAGT GGAGGAACT CTT C GGGCT C GAGGACT AC 



8; 



366 



72 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



367 



73 



427 



133 



487 



193 



547 



253 



607 



313 



667 



373 



727 



433 



787 



493 



847 



553 



907 



613 



967 



673 



T GGT GC CAGT GCGTGGCAT GGAGCT C CT CG GGCAC CACCAAGAGT CAGAAGGC CT AC AT C 426 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

TGGTGCCAGTGCGTGGCCTGGAGCTCTTCGGGAACTACCAAGAGTCGCCGAGCCTACATC 132 

CGCAT AGCCAGATT GC GCAAGAACTT C GAGCAGGAGC C GCTGGC CAAGGAGGT GTC C CT G 486 

I I I I I III I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I II II 
CGCATTGCCTACTTGCGCAAGAACTTTGACCAGGAGCCTCTGGCCAAGGAGGTACCCTTG 192 

GAGCAGGGCATCGT GCT GCCCT GC C GT CCACCGGAGGGCAT CCCT CCAGC C GAGGT GGAG 54 6 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
GATCATGAGGTCCTTCTGCAGTGCCGCCCACCGGAGGGAGTGCCTGTGGCTGAGGTGGAA 252 

T GGCTC C GGAACGAGGAC CT GGT GGACCC GT CCCT GGACCCCAAT GTATACAT CACGC GG 606 

I I I I I I I I I I I I I I I I I II I MINIMI I MM 

T GGCTCAAGAAT GAAGAT GT CATT GACCC CGCT C AGGACACTAACTT C CT GCT C AC CAT T 312 

GAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTG 666 
I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II II I I I I I I I I I I 
GACCACAAC CTCATCATCCGC CAGGC GCGCCT CTCAGACACGGCCAACTACACCT GT GT G 372 

GCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAAC 726 

I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I II I I I 
GCCAAGAAT ATCGTGGCCAAGC GCCGGAGCAC CAC GGC CACAGT CAT C GT CTAT GT GAAT 432 

GGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGG 7 86 

II I I I I I I I I I I I II I I I I I I I III I I I I II I I I II I I I I I 
GGAGGCTGGTCCAGCTGGGCAGAGTGGTCACCCTGTTCCAATCGCTGTGGCCGAGGCTGG 4 92 

CAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAG 84 6 

I II I I II I I I I I I I I I I II I I II II II I I I I I II I I I I I I I I I I I I I I 
CAGAAGCGT ACT CGGAC CT GCAC CAAT CCAGCCCCACT CAAT GGAGGCGCCTT CTGT GAG 552 

GGGCAGAATGTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGCTGGAGC 906 

II III I I I I I II I I I I I III I I I I I I I I I I I I I I I II II I I I I I 
GGACAGGCCTTC CAGAAGACAGCTT GCAC CAC CGT GTGC CCAGT GGAT GGAGC GTGGAC C 612 

CCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGC 966 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I II I I I 

GAGT GGAGCAAGT GGT CT GCCT GCAGCACAGAGT GT GC GCACTGGCGC AGC CGC GAGT GC 672 

T CT GACC CAGCAC CCC GCAACGGAGGGGAGGAGT GCCAGGGCACT GAC CT GGACACCC GC 1026 

I II I I I I I I I I I I I I I I I I I I I I I I I I II I M I 

AT GGCAC CGCCAC CCC AGAACGGAGGCCGT GACT GCAGC GGGACGCT ACT T GACT CCAAG 732 



1027 AACT GT ACC AGT GACCTCT GT GT ACACAGT GCTT CT GGC CCT GAGGAC 1074 

I I I M II II I I I I I II II I II I I 

AACT GCACT GAT GGGCT GT GCGT GCT GAAT C AGAGAACT CT AAACGAC CCTAAAAGC CAC 7 92 



733 



1075 



-GTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGC 1113 



Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db . 
Qy 



1 1 1 1 I I I 1 1 I I I I I I II I III 

793 CCCCTGGAGACATCGGGAGATGTGGCACTGTACGCAGGCCTTGTGGTGGCCGTCTTTGTG 852 

1114 CTGGTCCTGCTGCTGCTTGTCCT CATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTG 1170 

II I I I I I I I I I I I I I II I I I III II I 

GTGGTAGCGGTTCTCATGGCCGTGGGAGTGATCGTATACCGGAGAAACTGCCGGGACTTC 



853 



912 



1171 GACT CAGAT GT GGCT GACT C GT C CAT T CTC AC CTCAGGCT T C CAGCC CGT CAGC ATC 1227 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

913 GACACGGACATCACCGACTCCTCTGCGGCCCTCACTGGTGGCTTCCACCCTGTCAACTTC 



1228 



973 



1282 



972 



AAGC CCAGCAAAGCAGACAACC CC C AT CT GCT CAC CAT CCAGCCGGACCT CAGC 1281 

I I I I I I I I I I I I I I I I I I I II II I I I I I I I I 

AAGACTGCAAGGCCCAACAACCCGCAGCTCCTGCACCCGTCCGCCCCTCCAGACCTAACG 1032 



1328 



AC CAC CAC CAC CAC CTACCAGGGCAGT CT CT GT C CC CGGCAGGAT GG 

III I I I I I I I I II I I I I I I I I I I I I I 
1033 GC CAGT GCT GGCATCTAC CGCGGGCCTGT GT AT GC C CTGCAGGACT C CGC C GACAAGAT C 1092 

1329 GC C CAGC CCCAAGTTCCAGCT CAC CAAT 1356 

I I I I I I I I I I I I II II II II 
1093 CC CAT GACTAATT CGCCC CT GCT GGATC CCCT GC C CAGCCT CAAGAT CAAGGTCT AT AAC 1152 



1357 GGGCACCTGCTCAG- 



1153 



CCCCCTGGGTGGCGGC 1386 

I III I I I I I I I I I I I 

TCCAGCACCATCGGTTCTGGGTCTGGCCTGGCTGATGGAGCCGACCTGCTGGGTGTCCTC 1212 



1387 CGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTC 144 6 
II I I I I I I I I I I I I I I I I I III 

CCGCCGGGCACGTACCCAGGCGATTTCTCCCGGGACACCCATTTCCTGCACCTGCGCAGT 



1213 



1272 



1447 T C CAC C C AGAACT ACTT CC GCT C C CTGC CC CGAGGC ACCAGCAAC AT GACCT AT 1500 

I II I I I II I II I I I I I I I I I I I I I I I I I I 

1273 GCCAGCCTTGGTTCCCAGCACCTCCTGGGCCTACCTCGGGACCCCAGCAGCAGTGTCAGC 1332 

1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1560 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

1333 GGCACCTTTGGTTGCCTGGGAGGAAGGCTGAGCCT CCCCGGCACAGGGGT CAGCCT GTTG 1392 

1561 AT C CCC C CAGAT GCCATAC C CCGAGGGAAGATCT AT GAGAT CTACCT CACGCT GC ACAAG 1620 

III I I I I I I I I I I II III 1111111 I I I I I I I I I I I 

1393 GT ACCAAAT GGAGCCATT C C CCAGGGCAAGTT CT AT GACCT GTAT CT ACAT AT CAACAAG 1452 

1621 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1680 

I I I I I I II III I II I I I I I I I I II Mil 

1453 GCCGAAAGCACCCTCCCACTTTCAGAAGGTTCCCAGACAGTATTGAGCCCCTCGGTGACC 1512 

1681 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I 
1513 TGTGGGCCCACAGGCCTACTCCTGTGCCGCCCTGTCGTCCTCACCGTGCCCCACTGTGCT 



1572 



1741 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1800 

II I I I I I I I I I I I I I I I I I II I I I I I Mill MM 

1573 GAAGTCATCGCTGGAGACT.GGATCTTTCAGCTCAAGACCCAGGCCCATCAGGGCCACTGG 1.632 

1801 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1860 
I M I I I I I I I I I II I I I I I I I I I I I I I II I I I M II II I I I II 



Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 



1633 GAGGAGGTGGT GACCTT GGAT GAGGAGACCCT CAACACAC C CT GCT ACT GCC AGCT GGAG 1692 

1861 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1920 

III I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

GCTAAGTCCTGCCACATCCTGCTGGACCAGCTGGGTACCTACGTATTCATGGGCGAGTCC 



1693 



1921 



1753 



1752 



1980 



CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 
I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

TACTCTCGCTCTGCAGTCAAGCGGCTCCAGCTGGCCATCTTCGCCCCAGCCCTCTGCACC 1812 



1981 TCCCT CGAGT ACAACAT CC GGGT CT ACT GCCT GCAT GACACC CAC GAT GCACT CAAGGAG 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1813 TCCCTGGAGT AT AGCCT C AGGGT CT ACT GT CT GGAGGACACACCT GT AGCACT GAAGGAG 1872 

2041 GT GGT GCAGCT GGAGAAGCAGCT GGGGGGACAGCT GAT C C AGGAG C CAC GGGT CCT GCAC 2100 

II I I I I I I I I I I I I I I I I I I I I III I I II I I I I I I I I 
1873 GTCCTGGAGCTGGAGAGGACTCTGGGTGGCTACTTGGTGGAGGAGCCCAAGCCTTTGCTC 1932 

2101 TT CAAGGACAGTTACCACAAC CT GCGC CT AT CCAT CCAC GAT GT GCCC AGCT C CCT GT GG 2160 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III III 

TTTAAGGACAGTTACCACAAC CT AC GCCT CT C CCT CCAT GACAT C CCC CAT GCCCACT GG 



1933 



1992 



2220 



2161 AAGAGTAAGCT CCTT GT C AGCT AC CAGGAGAT CCC CTTTT AT CACAT CT GGAAT GGC AC G 

I III II II II I II I I I I I I I I I I I I I I I I II III I I I I I I I I II I I 
1993 AGGAGCAAACTACT GGC CAAGT AC C AGGAGATTC C CTT CTAC C ACGT CT GGAAT GGC AGC 2052 

2221 CAGCGGTACTT GCACT GCAC CTT C ACCCTGGAGCGTGT CAGCC CCAGCACT AGTGAC CT G 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III II I 

2053 CAGAGAGC CCT GCACT GCACTTT CACCCT GGAGAGGCAT AGCCT GGC CTCCACGGAGTTC 2112 

2281 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I II 

2113 ACCT GTAAGGT CT GCGT GC GGCAGGTC GAAGGGGAAGGC CAGATTTT C CAGCT GCACACA 2172 



2341 AACATCACC AAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGG 

I I I I I I I I. I M M I I I 

ACGTTGGCCGAGACGCCTGCTGGCTCCCTGGATGCTCTCTGCTCTGCCCCGGGCAATGCC 



2173 



2398 



2233 



2458 



2293 



2518 



2353 



GTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATA 

III 11111111111 I I I I I I I I I I I I I I I I I I I I I II I I I I I 
AT CACCACCCAGCTGGGACCCTATGCCTTCAAGATACCCCT GTCCATCCGCCAAAAGAT C 

ATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAA 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TGCAGCAGCCTGGACGCCCCCAACTCCCGGGGCAACGACTGGAGGCTGTTGGCGCAGAAG 



2397 



2232 



2457 



2292 



2517 



2352 



2577 



CT C C AC CTGGACAGC CAT CT CAGCTT CTTT GC CT CCAAGCC CAGC C CCACAGCCAT GAT C 
II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CT GT C CATGGACC GGT ACCTAAACT ACT TCGC CAC CAAAGCT AGT C C CAC AGGT GT CAT C 2412 



2637 



2578 CTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCA 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

2413 TTAGACCTCTGGGAAGCTCGGCAACAGGATGACGGGGACCTCAACAGCCTGGCCAGTGCC 2472 

2638 GTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2697 

III I I I I I I I I II I II I I I I I I I I I I I I I 

2473 TT GGAGGAGAT GGGCAAGAGT GAGAT GCT GGTAGC CAT GGCC AC AGAT GGC GATT G CT GA 2532 



RESULT 9 
BI758231 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



BI758231 1034 bp mRNA linear EST 25-SEP-2001 

603029876F1 NIH_MGC_114 Homo sapiens cDNA clone IMAGE: 5200171 5', 
mRNA sequence. 
BI758231 

BI758231.1 GI: 15749809 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 1034) 

NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 

Unpublished (1999) 

Contact: Robert Strausberg, Ph.D. 

Email : cgapbs-r@mail . nih . gov 

Tissue Procurement: Life Technologies, Inc. 

cDNA Library Preparation: Life Technologies, Inc. 

cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 

DNA Sequencing by: Incyte Genomics, Inc. 

Clone distribution: MGC clone distribution information can be 
found through the I.M.A.G.E. Consortium/LLNL at: 
http : //image . llnl . gov 

Plate: LLAM11501 row: g column: 20 
High quality sequence stop: 793. 

Location/Qualifiers 

1. .1034 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/ clone= " IMAGE :5200171" 
/lab_host="DH10B" 
/clone_lib="NIHJVtGC_114" 

/note="Organ: brain; Vector: pCMV-SPORT6; Site_l: NotI; 
Site_2: EcoRV (destroyed); RNA source anonymous pool of 6 
male brains, age range 23-27 yo. Library is oligo-dT 
primed and directionally cloned (EcoRV site is destroyed 
upon cloning). Average insert size 1.5 kb, insert size 
range 1-3 kb. Library is normalized and enriched for 
full-length clones and was constructed by C. Gruber 
(Invitrogen) . Research Genetics tracking code 019. Note: 
this is a NIH_MGC Library." 



ORIGIN 



Query Match 28.5%; 
Best Local Similarity 91.2%; 
Matches 918; Conservative 



Score 768.6; DB 4 
Pred. No. 1.5e-153 
0; Mismatches 74 



Length 1034; 
Indels 15; Gaps 



9; 



Qy 

Db 



105 GCCTGGTGCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATGTGTACAT 164 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I III I I I I I I I I 
1 GCCTGGTGCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATGTGTACAT 60 



Qy 165 CGTCAAGAACAAGCCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTT 224 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 

61 CGTCAAGAACAAGCCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTT 120 

225 CAAGTGCAAC GGGGAGTGGGTGC GCC AGGT GGACCACGT GAT C GAGCGC AGCAC AGAC GG 284 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
121 CAAGT GCAAC GGGGAGT GGGT GCGC C AGGT GGACCACGT GAT C GAGC GCAGCACAGAC GG 180 

285 GAGCAGT GGGCT GCC CAC CAT GGAGGTCCGCATTAATGTCTCAAGGC AGC AGGT CGAGAA 344 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
181 GAGCAGT GGGCT GC CCACCAT GGAGGT C C GC ATTAAT GT CT CAAGGC AGC AGGT C GAGAA 240 

345 GGTGTTCGGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCAC 404 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
241 GGTGTTCGGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCAC 300 

405 CAAGAGT C AGAAGGCCT AC ATCC GCATAGC C AGAT T GC GCAAGAACT T CGAGC AGGAGCC 464 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

301 CAAGAGT CAGAAGGCCTACATCC GCATAGC CTAT TT GC G CAAGAACTTCGAGC AGGAGCC 360 

465 GCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGG 524 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

361 GCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGG 420 

525 C AT CCCT C C AGC C GAGGT GGAGT GGCT CC GGAAC GAGGAC CT GGT GGAC C C GT C C CT GGA 584 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II 
421 CAT C CCT C CAGC C GAGGT GGAGT GGCT C C GGAAC GAGGAC CT GGT GGAC C C GT C C CT GGA 480 

585 CCCCAATGTATACATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGA 644 

I I.I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

481 CCCCAATGTATACATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGA 540 

645 CACGGCCAACTACACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGC 704 

I I I I I I I I I I I I I I I.I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

541 CACGGACAACTACACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGC 600 

705 TGCTGTCATCGTCTACGTGAACGGTGGGTGGTCGA-CGTGGACCGAGTGGTCCGTCTGCA 763 

I I I.I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

601 TGCTGTCATCGTCTACGTGAACGGTGGGTGGTCGACCGTGGACCGAGTGGTCCGTCTGC- 659 

764 GCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTC 823 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

660 GCGCCAGCTGTGGGCGCGGCTGGCAGAAACCGGAGCCGGAGCTGCACAACCCGGTGCCTC 719 

824 TCAACGGGGGCGCTTTCTGTGA-GGGGCAGAATGTCCAGAAAACAGCCTGCGCCACCCTG 882 

II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

720 TCAACGGGGGCGCTTTCTGTGAGGGGGCAGAATGTCCAGAAAGCAGC TGCGCCACCT 776 

883 TGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGT — GGGCT GGACT 940 

I I I I I I I II I II I I I I III I I I I I II I I I I I I I I I I I I I I I II III I 
777 GTGCCAGTGGACGGCAGCTGTAGCACGTGGAGCCAGT GGT CGGCCTGTT GGGCT TGGCTT 836 

941 GCAC CC ACT — GGCGGAGC C GT GAGT GCT CT GAC C C AGCAC C CCGCAAC GGAGGGGAGGA 998 

I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I MM III I 

837 -GCACCCACTTGGGCGGAGCCGGAGTGCTCTGAACCCAGCACCCCGGCACGGCAGGGGGAG 896 



999 GTG CCAGGGC ACT GAC CTGGACACCCGCAACT GT AC CAGTGACCTCT GT GT ACAC AG 1055 

I II I I I I I I I I II I I I I I I I I III I I I I I II I II II M I I M 



Db 



897 GTGTGCCCAGGTCACTGGACCTGGCACCCGGGA-TGGTCCAGTGAGCTCTGTGT-CCCAC 954 



Qy 1056 TGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGCCTCATCGCCG 1102 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I 
Db 955 GGGTTCTGGCCCTGAGGACTTGGCCTCCTATGTGGGCCTCATCCCGG 1001 



RESULT 10 

BC033727 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
PUBMED 
REFERENCE 
AUTHORS 
TITLE 
JOURNAL 



REMARK 
COMMENT 



Craniata ; Vertebrata ; Euteleos tomi ; 
Catarrhini; Hominidae; Homo. 



BC033727 1532 bp mRNA linear HTC 25-MAR-2004 

Homo sapiens unc-5 homolog A (C. elegans) , mRNA (cDNA clone 
IMAGE: 5166762 ) , containing frame-shift errors. 
BC033727 

BC033727.1 GI: 21707230 
HTC. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 

1 (bases 1 to 1532) 

Strausberg, R. L . , Feingold, E.A. , Grouse, L. H. , Derge, J. G. , 
Klausner,R.D. , Collins, F. S . , Wagner, L., Shenmen, C .M. , Schuler,G.D. 
Altschul, S. F. , Zeeberg,B., Buetow,K.H., Schaef er, C . F. , Bhat,N.K., 
Hopkins, R. F. , Jordan, H., Moore, T., Max,S.I., Wang, J., Hsieh,F., 
Diatchenko, L. , Marusina,K., Farmer, A. A., Rubin, G.M., Hong,L., 
Stapleton,M. , Scares, M.B. , Bonaldo,M.F. , Casavant, T . L . , 
Scheetz,T.E. , Brownstein,M. J. , Usdin,T.B. , Toshiyuki,S. , 
Carninci,P., Prange,C, Raha,S.S., Loquellano, N . A. , Peters, G. J., 
Abramson, R. D. , Mullahy, S . J. , Bosak,S.A., McEwan,P.J., 
McKernan, K. J. , Malek, J. A. , Gunaratne, P.H. , Richards, S . , 
Worley,K.C, Hale,S., Garcia, A.M., Gay,L.J., Hulyk,S.W., 
Villalon, D. K. , Muzny, D.M. , Sodergren, E. J. , Lu,X., Gibbs,R.A. , 
Fahey,J., Helton, E., Ketteman,M., Madan,A. , Rodrigues , S . , 
Sanchez, A., Whiting, M. , Madan,A. , Young, A. C, Shevchenko, Y . , 
Bouf f ard, G. G. , Blakesley, R.W. , Touchman, J.W. , Green, E. D. , 
Dickson, M. C. , Rodriguez, A. C. , Grimwood,J., Schmutz,J., Myers, R.M., 
Butterfield, Y.S. , Krzywinski,M. I . , Skalska,U. , Smailus,D.E. , 
Schnerch,A. , Schein,J.E., Jones, S.J. and Marra,M.A. 
Generation and initial analysis of more than 15,000 full-length 
human and mouse cDNA sequences 

Proc. Natl. Acad. Sci . U.S.A. 99 (26), 16899-16903 (2002) 
12477932 

2 (bases 1 to 1532) 
Strausberg, R. 
Direct Submission 

Submitted ( 02- JUL-2002 ) National Institutes of Health, Mammalian 
Gene Collection (MGC) , Cancer Genomics Office, National Cancer 
Institute, 31 Center Drive, Room 11A03, Bethesda, MD 20892-2590, 
USA 

NIH-MGC Project URL: http://mgc.nci.nih.gov 
Contact: MGC help desk 
Email : cgapbs-r @mail . nih . gov 
Tissue Procurement: Life Technologies, Inc. 
cDNA Library Preparation: Life Technologies, Inc. 
cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 
DNA Sequencing by: National Institutes of Health Intramural 
Sequencing Center (NISC) , 



Gaithersburg, Maryland; 

Web site: http://www.nisc.nih.gov/ 

Contact: nisc_mgc@nhgri.nih.gov 

Akhter, N. , Ayele, K. , Beckstrom-Sternberg, S .M. , Benj amin, B . , 
Blakesley, R.W. , Bouf f ard, G. G. , Breen,K., Brinkley,C, Brooks, S., 
Dietrich, N. L. , Granite, S., Guan,X., Gupta, J. , Haghighi,P., 
Hansen, N., Ho,S.-L., Karlins,E., Kwong,P., Laric,P., Legaspi,R., 
Maduro,Q. L. , Masiello, C. , Maskeri, B. , Mastrian, S . D. , McCloskey, J. C. , 
McDowell, J., Pearson, R. , Stantripop, S . , Thomas , P . J. , Touchman, J. W. , 
Tsurgeon,C, Vogt,J.L., Walker, M. A., Wetherby, K. D . , Wiggins, L., 
Young, A., Zhang, L.-H. and Green, E.D. 

Clone distribution: MGC clone distribution information can be found 
through the I.M.A.G.E. Consortium/LLNL at: http://image.llnl.gov 
Series: IRAK Plate: 68 Row: i Column: 2 

This clone was selected for full length sequencing because it 
passed the following selection criteria: GenomeScan gene prediction 
This clone has the following problem: frame shifted. 
FEATURES Location/Qualifiers 
source 1. .1532 

/organism="Homo sapiens" 

/mol__type= "mRNA" 

/db_xref="taxon: 9606" 

/ cl one- " IMAGE :5166762" 

/tissue_type="Brain, adult medulla" 

/clone_lib="NIHJVIGC_119" 

/lab_host="DH10B" 

/note="Vector: pCMV-SPORT6" 

ORIGIN 

Query Match 27.3%; Score 736.6; DB 3; Length 1532; 

Best Local Similarity 84.2%; Pred. No. l.le-146; 

Matches 917; Conservative 0; Mismatches 4; Indels 168; Gaps 1; 

Qy 292 GGGCTGCCCAC CAT GGAGGTCC GCATTAAT GT CT CAAGGCAGCAGGT CGAGAAGGT GT T C 351 

I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 612 GGGCT GCCCACCAT GGAGGTC CGCATTAAT GT CT CAAGGCAGCAGGT CGAGAAGGT GT T C 671 

Qy 352 GGGCTGGAGGAATACTGGT GCCAGT GCGT GGCAT GGAGCT C CT CGGGCACCAC CAAGAGT 411 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 672 GGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGT 731 

Qy 412 CAGAAGGCCT ACAT C CGCATAGCCAGATT GCGCAAGAACT T C GAGCAGGAGCCGCT GGCC 471 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 732 CAGAAGGCCT ACAT C CGCATAGCCTATTT GCGCAAGAACT T C GAGCAGGAGCCGCT GGCC 7 91 

Qy 472 AAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCT 531 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 792 AAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCT 851 

Qy 532 CCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAAT 591 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 852 CCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAAT 911 



Qy 

Db 



592 
912 



651 



971 



Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db- 



652 AACTACACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTC 711 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
972 AACTACACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTC 1031 

712 ATCGTCTACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGC 771 
I I I I I I I I I I I I 

1032 AT C GT CT AC GT G 1043 

772 TGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGG 831 

1044 1043 

832 GGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTA 891 

1044 : 1043 



892 



951 



GACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGG 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1044 GACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGG 1103 

952 CGGAGC CGT GAGT GCT CT GAC CCAGCAC C CC GCAAC GGAGGGGAGGAGT GCCAGGGCACT 1011 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1104 CGGAGC CGT GAGT GCT CT GAC C CAGC AC C C C GCAACGGAGGGGAGGAGT GC CAGGGC ACT 



1163 



1012 GACCT GGACAC C CGCAACT GT AC CAGT GAC CT CT GT GT ACAC AGT GCT T CT GGC C CT GAG 1071 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I 
1164 GACCT GGACAC C CGCAACT GT ACCAGTGAC CT CT GT GTACACACT GCT T CT GGCC CT GAG 1223 

1072 GACGTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTT 1131 

I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I 
GACGTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTT 



1224 



1283 



1132 



1284 



GTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCG 1191 
I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II 
GTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCG 134 3 



1192 TCC ATT CT CACCT CAGGCTT CCAGC CCGT CAGCATCAAGC CCAGCAAAGCAGACAACCC C 1251 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1344 TCCATTCTCACCTCAGGCTTCCAGCCCGTCAGCATCAAGCCCAGCAAAGCAGACAACCCC 1403 

1252 CATCTGCT CACCAT CCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCT C 1311 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1404 CATCTGCT CACCATCCAGCCGGACCTCAGCACCACCACCAC CACCT AC CAGGGCAGTCT C 1463 

1312 TGTCCCCGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGC 1371 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1464 TGTCCCCGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGC 1523 

1372 CCCCTGGGT 1380 

I I I I I I I I I 
1524 CCCCTGGGT 1532 



RESULT 11 
AI951556 

LOCUS AI951556 



788 bp mRNA linear EST 09-MAR-2000 



DEFINITION 



ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 

JOURNAL 
COMMENT 



FEATURES 

source 



Craniata; Vertebrata; Euteleostomi ; 
Catarrhini; Hominidae; Homo. 



(CGAP) , 



wv36f04.xl NCI_CGAP_Ovl8 Homo sapiens cDNA clone IMAGE : 2531647 3 f 
similar to TR:O08721 008721 TRANSMEMBRANE RECEPTOR UNC5H1. ;, mRNA 
sequence. 
AI951556 

AI951556.1 GI:5743866 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 
1 (bases 1 to 788) 

NCI-CGAP http : / /www. ncbi . nlm. nih . gov/ncicgap . 
National Cancer Institute, Cancer Genome Anatomy Project 
Tumor Gene Index 
Unpublished (1997) 
Contact: Robert Strausberg, Ph.D. 
Email: cgapbs-r@mail.nih.gov 

Tissue Procurement: Christopher A. Moskaluk, M.D., Ph.D., Michael 
R. Emmert-Buck, M.D., Ph.D. cDNA Library Preparation: M. Bento 
Soares, Ph.D. cDNA Library Arrayed by: Chris ta Prange, The 
I.M.A.G.E. Consortium DNA Sequencing by: Washington University 
Genome Sequencing Center 

Clone distribution: NCI-CGAP clone distribution information can be 
found through the I.M.A.G.E. Consortium/LLNL at: 
www-bio . llnl . gov/bbrp/image/image . html 
Insert Length: 1125 Std Error: 0.00 
Seq primer: -40UP from Gibco 
High quality sequence stop: 446. 

Location/Qualif iers 

1. .788 

/organism="Homo sapiens" 

/mol_type="mRNA" 

/db_xref="taxon:9606" 

/clone=" IMAGE: 2531647" 

/tissue_type="f ibrotheoma " 

/lab_host="DH10B (phage-resistant ) " 

/clone_lib="NCI_CGAP_0vl8" 

/note="Organ: ovary; Vector: pT7T3D-Pac (Pharmacia) with a 
modified polylinker; Site_l: Not I; Site_2 : Eco RI; 1st 
strand cDNA was primed with a Not I - oligo(dT) primer [5 1 
TGTTACCAATCTGAAGTGGGAGCGGCCGCGCGACATTTTTTTTTTTTTTTTTT 3 * ] ; 
double-stranded cDNA was ligated to Eco RI adaptors 
(Pharmacia), digested with Not I and cloned into the Not 
I and Eco RI sites of the modified pT7T3 vector. Library 
went through one round of normalization, and was 
constructed by Bento Soares and M. Fatima Bonaldo. " 



ORIGIN 



Query Match 27.3%; Score 735.2; DB 1; Length 788; 

Best Local Similarity 96.5%; Pred. No. 2e-146; 

Matches 749; Conservative 0; Mismatches 27; Indels 0; 



Gaps 



0; 



Qy 1424 CCGAGGAGTTCGTCTCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCA 1483 

I I II III I I I I I I I I I I I I I I I I III U I II I I II II I I I I I I I I I I I I I I I I I I I I I I 
Db 1 CCGAGGAGTTCGTCTCCCGCCTCTCCGCCCAGAACTACTTCCGCTCCCTGCCCCGAGGCA 60 



Qy 



1484 CCAGCAACATGACCTATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATA 1543 



Db 



61 



I I I I I I I I I I I I I I I 1 II I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I 
C CAGCAAC AT GAC CT AT GGGACCTT CAACTT CCT CGGGGGCCGGCT GAT GAT CC CTAAT A 120 



Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 



1544 CAGGTAT C AGC CT C CTCAT CCCCCC AGAT GCCAT ACC CC GAGGGAAGAT CT ATGAGATCT 1603 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

121 CAGGAATCAGCCT CCTCAT CCCCCCAGATGCCATACCCC GAGGGAAGAT CTATGAGAT CT 180 

1604 ACCTCACGCTGCACAAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGC 1663 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

181 ACCTCACGCTGCACAAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGC 240 

1664 TGAGTCCCATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGG 1723 
I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

241 TGAGTCCCATCGTTAGCTGTGGACCCCCTGGCGTTCTGCTCACCCGGCCAGTCATCCTGG 300 

1724 CT AT GGACCACT GT GGGGAGC CCAGC CCT GACAGCT GGAGCCTGCGC CT CAAAAAGCAGT 1783 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

301 CTATGGACCACTGTGGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGT 360 

1784 CGTGCGAGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCT 1843 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

361 CGTGCGAGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCT 420 

1844 ACTACTGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTG 1903 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

ACTACTGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGAGCCGCTATG 480 



421 



1963 



1904 CCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
481 CCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTG 540 

1964 CGCCGGTGGCCTGCACCTCCCTCGAGTACAACATCCGGGTCTACTGCCTGCATGACACCC 2023 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CGCCGGTGGCCTGCACCTCCCTCGAGTACAACATACTGGTCTACTGCCTGCATGACACTC 600 



541 



2024 AC GATGC ACT CAAGGAGGTGGT GCAGCT GGAGAAGCAGCT GGGGGGACAGCT GAT CCAGG 2083 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
601 AC GAT GCACT CAAC GT AGT GGT GCAGCT GGAGAAGCAGCT GCAGGGACAGCT GAT C CAGG 



660 



2084 AGC C AC GGGT C CT GCACTT CAAGGACAGTT AC CACAACCT GC GCCT ATCCAT CCAC GATG 2143 
I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGC CACT GGT ACT GCACTT CAAGGACAGTT ACC ACAACCT GC GCCT ATNCAT CCAC GATG 720 



661 



2199 



2144 TGCCCAGCTCCCTGTGGAAGAGTAAGCTCCTTGTCAGCTACCAGGAGATCCCCTTT 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

721 T GCCCAGCTNCCNT GT GGAGAGTAAGCTT CTTGT CAGCT ACCCAGAGAT C CNCTAT 776 



RESULT 12 

BX348193/C 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 



BX348193 796 bp mRNA linear EST 08-APR-2004 

BX348193 Homo sapiens NEUROBLASTOMA COT 10-NORMALIZED Homo sapiens 
cDNA clone CS0DB008YE02 5-PRIME, mRNA sequence. 
BX348193 

BX348193.2 GI: 46286231 
EST. 

Homo sapiens (human) 



ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 796) 

Li,W.B., Gruber,C, Jessee,J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished (2001) 

On May 5, 2003 this sequence version replaced gi: 30367258. 
Contact : Genoscope 

Genoscope - Centre National de Sequencage 

2 rue Gaston Cremieux, CP 5706 - 91057 EVRY cedex - FRANCE 
Email: seqref@genoscope.cns.fr, Web : www.genoscope.cns.fr 

1st strand cDNA was primed with a Notl-oligo (dT) primer. Five prime 
end enriched, double-strand cDNA was digested with Not I and cloned 
into the Not I and EcoR V sites of the pCMVSPORT 6 vector. Library 
was normalized. Library was constructed by Life Technologies, a 
division of Invitrogen. This sequence belongs to sequence cluster 
3239. r 

For more information about this cluster, see 

http : //www. genoscope . ens . f r/cdna?s=CSOBAF004ZD01_AF00293_l&c=3239 . r 

Location/Qualifiers 
1. .796 

/organism="Homo sapiens" 
/ mo l_t yp e= " mRNA" 
/db_xref="taxon: 9606" 
/clone="CS0DB008YE02" 

/ t is sue_type= "NEUROBLASTOMA COT 10 -NORMALIZED" 
/clone_lib="Homo sapiens NEUROBLASTOMA COT 10-NORMALIZED" 
/note="lst strand cDNA was primed with a Notl-oligo (dT) 
primer. Five prime end enriched, double-strand cDNA was 
digested with Not I and cloned into the Not I and EcoR V 
sites of the pCMVSPORT 6 vector. Library was normalized." 



ORIGIN 



Query Match 26.8%; 
Best Local Similarity 96.4%; 
Matches 758; Conservative 



Score 721.6; DB 5; 
Pred. No. 1.7e-143; 
0; Mismatches 26; 



Length 796; 



Indels 



2 ; Gaps 



2; 



Qy 1634 GGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTG 1693 

II III I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7 95 GT T GCCCCAAAC CGGGCT GT CAGACCCT GTTGAGT C CCAT GGTT AGCTGT GAA- C C CCT G 737 



Qy 1694 GCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCTG 1753 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 736 GCGTCCTGCTCACCGGCCCAGTCATCCTGGGTATGGACCACTGTGGGGAGCCCAGCCCTG 677 

Qy 1754 ACAGCTGGAGCCTGCGCCTC-AAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTG 1812 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 676 ACAGCT GAGGCCT GC GCCT CAAAAAAACAGT CGT GCGAGGACAGCT GGGAGT AT GT CCTG 617 

Qy 1813 CACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGC 1872 

I I I I I I I I I I I I I I I I I I II I I I II I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 616 CACCTGGGCGAGNAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGC 557 

Qy 1873 TACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCT 1932 

I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 



Db 556 TACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCT 497 

Qy 1933 GCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTAC 1992 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 496 GCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTAC 437 

Qy 1993 AACAT C C GGGT CT ACT GCCT GCAT GACACCCAC GAT GCACT CAAGGAGGT GGT GC AGCT G 2052 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 436 AACATCCGGGTCTACT GCCT GCAT GACACCCAC GAT GCACT CAAGGAGGT GGTGCAGCT G 377 

Qy 2053 GAGAAGCAGCT GGGGGGACAGCT GAT C C AGGAGC C AC GGGT CCT GCACTT CAAGGACAGT 2112 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I 
Db 376 GAGAAGCAGCT GGGGGGACAGCT GAT CCAGGAGCCAC GGGT CCTGCACTT CAAGGACAGT 317 

Qy 2113 T ACCACAAC CT GCGC CT AT C CAT C CAC GAT GT GC CCAGCT C C CTGT GGAAGAGTAAGCT C 2172 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 316 T ACCACAAC CT GCG C CT AT C CAT C CAC GAT GT GC CCAGCT C CCT GT GGAAGAGTAAGCT C 257 

Qy 2173 CT T GT CAGCT ACCAGGAGAT CCC CT TTT AT C ACAT CT GGAAT GGC AC GC AGCGGT ACTT G 2232 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 256 CT TGT CAGCT ACCAGGAGAT CC CCT TTT AT C ACAT CT GGAAT GGC ACGCAGCGGT ACTT G 197 

Qy 2233 CACT GCACCTT CAC C CTGGAGCGT GT C AGCCC CAGCACTAGT GAC CT GGC CT GCAAGCT G 2292 

I I I I I I I I I I I I I I I I I I I I I I I Ml I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 196 CACTGCAC CTT CAC C CT GGAGCGT GT CAGC CC CAGCACTAGT GAC CT GGCCT GCAAGCT G 137 

Qy 2293 T GGGT GT GGCAGGT GGAGGGCGACGGGCAGAGCTT CAGCAT CAACTT CAACATCACCAAG 2352 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 136 T GGGT GT GGCAGGT GGAGGGC GACGGGCAGAGCTTCAGC AT CAACTT CAACAT CAC CAAG 77 

Qy 2353 GACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTG 2412 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 76 GACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGNCCCTGGT 17 

Qy 2413 GGCCCC 2418 

II III 

Db 16 GGGCCC 11 



RESULT 13 

BI818609 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



BI818609 818 bp mRNA linear EST 04-OCT-2001 

603033362F1 NIH_MGC_115 Homo sapiens cDNA clone IMAGE : 5174559 5», 
mRNA sequence. 
BI818609 

BI818609.1 GI:15929902 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 818) 

NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 

Unpublished (1999) 

Contact: Robert Strausberg, Ph.D. 

Email: cgapbs-r@mail.nih.gov 



Tissue Procurement: Life Technologies, Inc. 
cDNA Library Preparation: Life Technologies, Inc. 
cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 
DNA Sequencing by: Incyte Genomics, Inc. 

Clone distribution: MGC clone distribution information can be 
found through the I.M.A.G.E. Consortium/LLNL at: 
http: //image . llnl . gov 
Plate: LLAM11434 row: 1 column: 16 
High quality sequence stop: 744. 
FEATURES Location/Qualifiers 
source 1. .818 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/clone="IMAGE: 5174559" 
/lab_host="DH10B" 
/clone_lib="NIH_MGC_115" 

/note="Organ: pooled brain, lung, testis; Vector: 
pCMV-SPORT6; Site_l: NotI; Site_2 : EcoRV (destroyed); RNA 
source anonymous pool of 6 male brains, age range 23-27; 1 
male lung, age 27; and 1 male testis, age 69. Library is 
oligo-dT primed and directionally cloned (EcoRV site is 
destroyed upon cloning). Average insert size 1.8 kb, 
insert size range 1-3 kb. Library is normalized and 
enriched for full-length clones and was constructed by C. 
Gruber (Invitrogen) . Research Genetics tracking code 
021. Note: this is a NIH_MGC Library." 

ORIGIN 

Query Match 26.5%; Score 713.4; DB 4; Length 818; 

Best Local Similarity 97.6%; Pred. No. 9.4e-142; 

Matches 745; Conservative 0; Mismatches 16; Indels 2; Gaps 2; 



Qy 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 

I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 4 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 63 

Qy 61 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 120 

I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 64 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 123 

Qy 121 GACCT GCT T C CCCACTT C CT GGT GGAGCCC GAGGAT GT GT ACAT CGT CAAGAACAAGC CA 180 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 124 GACCT GCTT CCC CACTT CCT GGTGGAGCCC GAGGAT GT GT AC AT CGT CAAGAACAAGC CA 183 

Qy 181 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 240 

I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 184 GT GCT GCTT GTGTGCAAGGC CGT GCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 243 

Qy 241 TGGGT GCGCCAGGT GGACCACGT GAT CGAGC GCAGCACAGACGGGAGCAGTGGGCT GC CC 300 

I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 244 TGGGT GCGCCAGGT GGACCACGT GAT CGAGC GCAGCACAGACGGGAGCAGT GGGCT GC CC 303 

Qy 301 ACCAT GGAGGT C C GC ATTAAT GT CT CAAGGCAG CAGGT CGAGAAGGT GTT CGGGCT GGAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 304 ACCATGGAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAG 363 



Qy 

Db 



361 GAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
364 GAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCC 423 



Qy 421 TACAT CCGCAT AGC C AGATT GCGCAAGAACTTC GAGCAGGAGC CGCTGGCCAAGGAGGT G 4 80 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 424 TACAT CCGCAT AGC CT ATT T GCGCAAGAACTTC GAGCAGGAGC CGCTGGCCAAGGAGGT G 483. 

Qy 481 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 484 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 543 

Qy 541 GTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATC 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 544 GTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATC 603 

Qy 601 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 604 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 663 

Qy 661 TGCGTGGCCAAGAACATCGTGGCACGTC-GCCGCAGCGCCTCCGCTGCTGTCATCGTCTA 719 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 664 TGCGTGGCCAAGAACATCGTGGCACGTCAGCCGCAGGGCCTCCGCTGCTGTCATCGTCTA 723 

Qy 720 CGTGAACGGTGGGTGGTCGACG-TGGACCGAGTGGTCCGTCTG 761 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 724 CGTGGACGGCAGCTGGAGCCCGTTGGAGCCAGTGGTCGGGCTG 7 66 



RESULT 14 

AY411748 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
PUBMED 
REFERENCE 
AUTHORS 



TITLE 
JOURNAL 



Craniata; Vertebrata; Euteleostomi ; 
Catarrhini; Hominidae; Pan. 



AY411748 2532 bp DNA linear GSS 12-DEC-2003 

Pan troglodytes HCM4327 gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY411748 

AY411748.1 GI: 39767716 
GSS. 

Pan troglodytes (chimpanzee) 
Pan troglodytes 
Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 

1 (bases 1 to 2532) 

Clark, A. G., Glanowski, S . , Nielson,R., Thomas, P., Kejariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D. R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 

Inferring nonneutral evolution from human- chimp-mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 

2 (bases 1 to 2532) 

Clark, A. G., Glanowski, S . , Nielson,R., Thomas, P., Kejariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 
Direct Submission 

Submitted ( 16-NOV-2003) Celera Genomics, 45 West Gude Drive, 



Rockville, MD 20850, USA 
COMMENT This sequence was made by sequencing genomic exons and ordering 

them based on alignment. 
FEATURES Location/Qualifiers 
source 1. .2532 

/organism="Pan troglodytes" 
/mol_type=" genomic DNA" 
/ db_xr e f = " t axon : 9 5 9 8 " 
gene <1. .>2532 

/locus_tag="HCM4327" 

ORIGIN 

Query Match 25.1%; Score 678.2; DB 9; Length 2532; 

Best Local Similarity 54.4%; Pred. No. 3.7e-134; 

Matches 1370; Conservative 0; Mismatches 1021; Indels 129; Gaps 9; 

Qy 307 GAGGTCCGCATTAATGT CTCAAGGCAGCAGGT CGAGAAGGT GTT C GGGCT GGAGGAAT AC 366 

I I I I I I II I I I I I I I I II II I II III II I II II I II I I I I II III 
Db 13 GAGGTGCAGAT CGAGGT GTCGCGGCAGCAGGT GGAGGAGCT CTT T GGGCTGGAGGATT AC 72 

Qy 367 T GGT GCCAGT GCGT GGCAT GGAGCT CCT CGGGCAC C AC CAAGAGT CAGAAGGCCT AC AT C 426 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 73 T GGT GCCAGT GCGT GGCCT GGAGCT CT GC GGGCAC C AC CAAGAGT CGCCGAGCCT AC GTC 132 

Qy 427 CGCAT AGCCAGATT GC GCAAGAACTTCGAGC AGGAGCC GCT GGC CAAGGAGGT GT C CCT G 486 

I I I I I III 

Db 133 CGCATCGCCTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 192 

Qy 487 GAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAG 54 6 

I II I I 

Db 193 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGTGGAA 252 

Qy 547 TGGCT CC GGAACGAGGAC CT GGT GGAC C C GT C C CT GGAC CCCAAT GTAT ACAT CAC GCGG 606 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 253 TGGCTCAAGAAT GAGGAT GT CAT C GACC C CAC C C AGGACACCAACT TC CT GCT CAC CATC 312 

Qy 607 GAGCACAGC CT GGT GGT GCGACAGGCCC GCCTTGCT GACACGGCCAACT ACACCT GC GT G 666 

II I I I I III I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 313 GAC C ACAAC CT CAT CAT CCGC CAGGCCC GC CT GT CGGACACT GCCAACT ATAC CT GCGT G 372 

Qy 667 GCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAAC 726 

I I I I I I I I I I I I I I I I I I I I I I III II I II I I I I I I I I I I I I I I I I I I 

Db 373 GCCAAGAACAT CGT GGCCAAACGCC GGAGC ACCACTGC CACC GT CATC GT CT ACGT GAAT 432 

Qy 727 GGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGG 786 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 433 GGCGGCTGGTCCAGCTGGGCAGAGTGGTCGCCCTGCTCCAACCGCTGTGGNNGANNCTGG 492 

Qy 787 CAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAG 846 

I I I I I II I I I I I I I I I II I I I I I I I II II I I I I I I I I II I I I I III 

Db 493 CAGAAGCGCACCCGGACCTGCACCAACCCCGCCCCACTCAACGGAGGGNNNNTCTGCGAG 552 

Qy 847 GGGCAGAAT GT CCAGAAAACAGCCT GC GCCACCCT GT GC C C AGT AGACGGCAGCT GGAGC 906 

I I 1 1 i ii ii nil 

Db 553 GGC CANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN T C GAT GGGGCGT GGACG 612 



Qy 



907 



CCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGC 966 



I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I INN I I I I I I 

Db 613 GAGTGGAGCAAGTGGTCAGCCTGCAGCACTGAGTGTGCCCACTGGCGTAGCCGCGAGTGC 672 

Qy 967 T CT GACCCAGC AC C C C GCAAC GGAGGGGAGGAGT GC CAGGGCACT GAC CT GGACAC C C GC 1026 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 673 ATGGCGCCCCCACCCCAGAACGGAGGCCGTGACTGCAGCGGGACGCTGCTCGACTCTAAG 732 

Qy 1027 AACT GTACC AGT GAC CT CT GT GT AC ACAGT GCT T CT 1062 

I I I I I I I II I I I I I I I I I 
Db 733 AACT GCAC AGAT GGGCT GT GCAT GCAAAATAAGAAAACTCT AAGCGAC CC CAACAGCCAC 792 

Qy 1063 GGCCCTGAGGACGTGGCCCTCTATGTGGGCCTC ATCGCCGTGGCCGTC 1110 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 793 CTGCTGGAGGCCTCAGGGGATGCGGCGCTGTATGCGGGGCTCGTGGTGGCCGTCTTCNTG 852 

Qy 1111 TGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTG 1170 

I I II I I I I I II I I I I I I I I II I I I I 

Db 853 GTCNTGGCAATCCTCATGGCGGTGGGGGTGGTGGTGTACCGCCGCAACTGCCGTGACTTC 912 

Qy 1171 GACT CAGAT GT GGCT GACTCGT CCATT CTCACCTCAGGCTTCCAGCCCGTCAGCATC 1227 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 913 GACACAGACATCACTGACTCATCTGCTGCCCTGACTGGTGGTTTCCACCCCGTCAACTTT 972 

Qy 1228 AAGC C CAGCAAAGCAGACAAC C C CCAT CT GCT CACCATCCAGCCGGACCTCAGC 1281 

I I I I I I I I I I I I I I I I I I II II I I I I I I I I 

Db 973 AAGACGGCAAGGCC CAGCAAC C C GC AGCT C CT ACAC C CCT CT GT GC CT CCT GAC CT GAC A 1032 

Qy 1282 ACCAC CAC CACCACCTAC CAGGGCAGT CT CT GT CCCCGGCAGGAT GGG 1329 

I I I I II I I I I I I I II ' I I I I I I I I I I I I 

Db 1033 GCCAGCGC C GGCAT CT AC CGC GGACCC GT GT AT GCCCT GCAGGACT C CAC C GACAAAAT C 1092 

Qy 1330 CCCAGCCCCAAGTTCCAGCTCACCA— 1354 

I I I I I II III II M II II 
Db 1093 CCCATGACCAACTCTCCTCTGCTGGACCCCTTACCCAGCCTTAAGGTCAAGGTCTACAGC 1152 

Qy 1355 ATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCC ACACA 1395 

I I I I I I I I I I I I I I I II I I I 

Db 1153 TCCAGCACTACGGGCTCTGGGCCAGGCCTGGCAGATGGGGCTGACCTGCTGGGAGTCTTG 1212 

Qy • 1396 CT GCACCACAGCT CT CCCACCT CT GAGGCCGAGGAGTT CGT CTCC CGC CT CTC CAC C CAG 1455 

III II Ml I I I I I I I I I I I I II I I I 

Db 1213 CCGCCTGGCACATACCCTAGCGATTTCGCCCGGGACACCCACTTCCTGCACCTGCGCAGC 1272 

Qy 1456 AACTACTTCCGCTC CCT GCCCCGAGGCACCAGCAACAT GAC CTAT 1500 

I I II I I I I I I I I I I I I I I I I III I 

Db 1273 GCCAGCCTCGGTTCCCAGCAGCTCTTGGGCCTGCCCCGAGACCCAGNNAGCAGCGTCAGC 1332 

Qy 1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1560 

I I II II I I I I I I I I I I 

Db 1333 GGCACCTTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGGGTCAGCTTGCTG 1392 

Qy 1561 ATCCC CCCAGAT GCCAT ACC C CGAGGGAAGATCT AT GAGAT CT AC CT CACGCT GCACAAG 1620 

I I I I I I I I II II I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 1393 GT GCCCAATGGAGCCATT CCC CAGGGCAAGTT CT AC GAGAT GT AT CT ACT CAT CAACAAG 1452 

Qy 1621 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1680 

I I I I II II II I I I I I I I I I I I I I I I I I 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1453 GC AGAAAGTAC CCT CCCGCTTT C AGAAGGGAC CC AGACAGTATTGAGCC CCT CAGT GACC 1512 

1681 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1740 

I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I IN I I I I I I I I 

1513 TGTGGACCCACAGGCCTCCTGCTGTGCCACCCCGTCATCCTCACCATGCCCCACTGTGCC 1572 

1741 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1800 

II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1573 GAAGT CAGTGC C C GT GACT GGAT CT T T CAGCT CAAGACCC AGGCC C ACCAGGGC CACT GG 1632 

1801 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1633 GAGGAGGT GGT GAC C CTGGAT GAGGAGACC CT GAACAC ACCCTGCT ACT GC CAGCT GGAG 1692 

1861 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1920 

I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I 

1693 CCCAGGGCCTGTCACATCCTGCTGGACCAGCTGGGCACCTACGTGTTCACGGGCGAGTCC 1752 

1921 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 1980 

I III III I I I I I I I I I I I I I I I I I I I 

1753 TATTCCCNNNNNNCAGTCNNNNNGCTCCNGCTGGCCGTCTTNGCCCCTGCCCTCTGCACC 18 12 

1981 T CC CT CGAGT ACAACATCCGGGT CT ACT GCCT GCAT GACAC CC AC GAT GCACTCAAGGAG 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I II I 

1813 TCCCTGGANNNNNGCCTCCGGGTCTACTGCCTGGNNNNNNNNNNNNNNNNNNNNNNNGAG 1872 

2041 GT GGT GCAGCT GGAGAAGCAGCT GGGGGGACAGCT GAT CCAGGAGCCACGGGTC CT GC AC 2100 

I I I I I I I I I I I I I I MINIMI Ml I I I I I I I II 
1873 GTGCTGGAGCTGGAGCGGACTCTGGGCGGATACTTGGTGGAGGAGCCGAAACCGCTAATG 1932 

2101 TT CAAGGACAGTT AC CACAACCT GC GCCT ATCC AT C CACGAT GT GCCCAGCT CC CTGT GG 2160 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I III III 

1933 TTCAAGGACAGTTACCACAACCTGCGCCTCTCCCTCCATGACCTCCCCCATGCCCATTGG 1992 

2161 AAGAGTAAGCT C CT T GTC AGCT ACCAGGAGAT C CC CTTTT AT CACAT CT GGAAT GGCACG 2220 

I III I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
1993 AGGAGCAAGCT GCT GGCCAAAT ACCAGGAGAT C CCCTT CT GTCACATTT GGAGT GGCAGC 2052 

2221 CAGC GGT ACTT GCACT GCACCTT CACCCT GGAGC GT GT CAGCCCCAGCACT AGT GAC CT G 2280 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II l| 

2053 CAGAAGGC CCT CCACT GCACTTT CACCCT GGAGAGGC ACAGCTT GGC CT CC ACAGAGCT C 2112 

2281 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I. I I I I III I I I 

2113 ACCTGCAAGATCTGCGTGCGGCAAGTGGAAGGGGAGGGCCAGATATTCCAGCTGCATACC 



2172 



2341 AAC AT CACCAAG GACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGG 2397 

I I I I I III II II I II 

2173 ACTCTGGCAGAGACACCTGCTGGCTCCCTGGACACTCTCTGCTCTGCCCCTGGCAGCACT 2232 



2398 



2457 



GTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATA 
I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I 
2233 GT CACCAC CCAGCT GGGACCTT AT GCCTT CAAGAT CCCACT GTC CAT CCGC CAGAAGAT A 2292 

2458 ATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAA 2517 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2293 T GCAACAGCCT AGAT GCCC CCAACT C ACGGGGCAAT GACT GGC GGAT GTT AGCACAGAAG 2352 



Qy 

Db 



2518 
2353 



CT CCACCT GGAC AGCCAT CT CAGCTT CTTT GCCT CCAAGCC CAGCCC CACAGCCAT GAT C 2577 

III I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

CT CT CTAT GGAC CGGT AC CT GAATT ACTTT GCC AC CAAAGCGAG CC C C AC GGGT GT GAT C 2412 



Qy 2578 CTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCA 2637 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 2413 CTGGACCTCTGGGAAGCTCTGCAGCAGGACGATGGGGACCTCAACAGCCTGGCGAGTGCC 2472 

Qy 2638 GTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2697 

III I I I I II I I II I I I I I I I I I I I I I I 

Db 2473 TTGGAGGAGATGGGCAAGAGTGAGATGCTGGTGGCTGTGGCCACCGACGGGGACTGCTGA 2532 



RESULT 15 

BF311804 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



GI: 11259566 



(human) 



Craniata; Vertebrata; Euteleostomi ; 
Catarrhini; Hominidae; Homo. 



BF311804 934 bp mRNA linear EST 21-NOV-2000 

601897316F1 NIH_MGC__19 Homo sapiens cDNA clone IMAGE : 4126706 5', 
mRNA sequence. 
BF311804 
BF311804.1 
EST. 

Homo sapiens 
Homo sapiens 

Eukaryota; Metazoa; Chorda ta; 
Mammalia; Eutheria; Primates; 
1 (bases 1 to 934) 
NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 

Unpublished (1999) 

Contact: Robert Strausberg, Ph.D. 

Email : cgapbs-r@mail . nih . gov 

Tissue Procurement: ATCC 
cDNA Library Preparation: Ling Hong/Rubin Laboratory 
cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 
DNA Sequencing by: Incyte Genomics, Inc. 

Clone distribution: MGC clone distribution information can be 
found through the I.M.A.G.E. Consortium/LLNL at: image.llnl.gov 
Plate: LLCM1016 row: p column: 03 
High quality sequence stop: 707. 
Location/Qualifiers 
1. .934 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/clone="IMAGE: 4126706" 
/tissue_type="neuroblastoma " 
/lab_host="DH10B (phage-resistant ) " 
/ cl one_l ib= " N I H_MGC_1 9 " 

/note="Organ: brain; Vector: pOTB7; Site_l: Xhol; Site_2: 
EcoRI; cDNA made by oligo-dT priming. Directionally 
cloned into EcoRI/XhoI sites using the following 5 1 
adaptor: GGCACGAG ( G ) . Library constructed by Ling Hong 
in the laboratory of Gerald M. Rubin (University of 
California, Berkeley) using ZAP-cDNA synthesis kit 
(Stratagene) and Superscript II RT (Life Technologies) . 
Note: this is a NIH MGC Library." 



ORIGIN 



Query Match 24.9%; 
Best Local Similarity 93.3%; 
Matches 747; Conservative 



Score 672.6; DB 2; 
Pred. No. 5.1e-133; 
0; Mismatches 49; 



Length 934, 



Indels 



5; Gaps 



4; 



Qy 1071 GGACGTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCT 1130 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2 GGACGTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCT 61 

Qy 1131 TGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTC 1190 

I I I I I I I I I I I I I I I I I I I I I I II I I I I 1 I I I I I I II I I I I I I I I I I I I II I I I I I I I I I 

Db 62 TGT C CT CAT C CT CGTTT ATT GCC GGAAGAAGGAGGGGCT GGACT C AGAT GT GG CT GACT C 121 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1191 GT C CAT T CT C ACCT CAGGCTT CC AGCCC GT CAGCAT CAAGCC CAGCAAAGC AGACAAC C C 1250 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
GT CCAT T CT C ACCT CAGGCTT CCAGC CC GT CAGC ATCAAGC C CAGCAAAGC AGACAAC CC 



122 



1251 



182 



181 



CCATCT GCTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGT CT 1310 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCAT CT GCT CACCATCCAGCCGGACCT CAGCACCACCACCAC CACCTACCAGGGCAGT CT 



241 



1311 CTGTCCCCGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAG 1370 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTGTCCCCGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAG 



242 



301 



1371 CCCCCTGGGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGA 14 30 
I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCC C CT GGGT GGC GGCC GCCACACACT GCAC CACAGCT CT C C CACCTCT GAGG CC GAGGA 



302 



361 



1431 GTTCGTCTCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAA 1490 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I J I 

GTTCGTCTCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAA 



362 



421 



14 91 CATGACCTATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTAT 1550 
I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I II I I I I I I II 
CATGACCTAT GGGACCTT CAACTTCCT C GGGGGCCGGCT GAT GAT C CCTAAT ACAGGAAT 



422 



481 



1551 C AGCCTCCT CAT C CCC CCAGATGCCAT ACCCCGAGGGAAGATCT ATGAGAT CT AC CT CAC 1610 
III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
482 CAG-CT CCT CAT C CCC CCAGATGCCAT ACCCCGAGGGAAGATCT AT GAGAT CT AC CT CAC 54 0 

1611 GCTGCACAAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCC 1670 

I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 GCT GCACAAGC C GGAAGAC GT GAGGTT G- CCCT AGCT GGCT GTCAGAC CCT GCTGAGT C C 599 

1671 CATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCC — T GGCT AT G 1728 
I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
600 CATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCAACCGGGCAGTCATCCCTGGCTAATG 659 

1729 GACCACT GT GGGGAGC CCAGCCCT GAC AGCT GGAGCCT GCGCCT CAAAAAGC AGT C GT GC 1788 
I I I I III I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

660 GACCCACTGTGGGGAAGCCAGCCTGACAGTT GGAGCCT GGGCTCAAAAAGGAGTCGGTGC 719 

17 89 GAGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTAC 1848 
I I I I I I I I I I I I I I I I I I I I I I I II III II III I I I I I I I I I I I I II 
720 GAGGGC AGCT GGGA- GAT GT GCT GGACT GGGGGAAGAAGGGGGCCTCCACCCTCT ATT AT 778 



Qy 1849 TGCCAGCTGGAGGCCAGTGCC 1869 

I I I I I II I I I I I I II 
Db 779 TGGCAGTGGGAGGCAAGGCCC 799 



Search completed: March 6, 2005, 10:10:35 
Job time : 8489.11 sees 



GenCore version 5.1.6 
Copyright (c) 1993 - 2005 Compugen Ltd. 



OM nucleic - nucleic search, using sw model 
Run on: 



Title: 
Perfect score: 2697 



March 5, 2005, 15:11:26 ; Search time 11456.2 Seconds 

(without alignments) 
11407.261 Million cell updates/sec 

US-10-624-932-1 COPY 46 2742 



Sequence: 



1 atggccgtccggcccggcct tgtcggaggctgagtgctga 2697 



Scoring table: IDENTITY_NUC 

Gapop 10.0 , Gapext 1.0 



Searched: 



4708233 seqs, 24227607955 residues 



Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 



9416466 



Database 



GenEmbl : 



1 




gb_ba : * 


2 




gb_htg : * 


3 




gb_in: * 


4 




gb_om: * 


5 




gb ov: * 


6 




gb_pat : * 
gb ph : * 


7 




8 




gb pi : * 


9 




gb_pr : * 


10: 


gb_ro : * 


11: 


gb sts:* 


12: 


gb sy:* 


13: 


gb_un : * 


14: 


gb_vi : * 



Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 



SUMMARIES 



% 

Result Query 

No. Score Match Length DB ID 



Description 



1 2697 100.0 2752 6 AX449572 
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RESULT 1 
AX449572 
LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



AX449572 2752 bp 

Sequence 1 from Patent WO0210216. 
AX449572 

AX449572.1 GI:21698195 



DNA 



linear PAT 03-JUL-2002 



Homo sapiens (human) 
Homo sapiens 
Eukaryota ; Metazoa ; 



Chordata; Craniata; Vertebrata; Euteleostomi ; 



Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
REFERENCE 1 

AUTHORS Padigaru,M., Mezes,P., Mishra,V., Burgess,C, Casman,S., . 

Grosse, W.M. , Alsobrook, J. P. , Lepley, D.M. , Gerlach, V. L. , 
Macdougall, J.R. and Smithson,G. 
TITLE Proteins and nucleic acids encoding same 

JOURNAL Patent: WO 0210216-A 1 07-FEB-2002; 
Curagen Corporation (US) 
FEATURES Location/Qualifiers 
source 1. .2752 

/organism="Homo sapiens" 
/mol_type="unassigned DNA" 
/db_xref="taxon: 9606" 

ORIGIN 

Query Match 100.0%; Score 2697; DB 6; Length 2752; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2697; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 

I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 4 6 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 105 

Qy 61 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 120 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 106 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 165 

Qy 121 GACCTGCTT C CC CACTT CCT GGT GGAGCCC GAGGAT GT GT ACAT C GT CAAGAACAAGCC A 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 166 GACCTGCTT CCC CACTT CCT GGT GGAGCCCGAGGAT GT GTACAT C GT CAAGAACAAGCCA 225 

Qy 181 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 226 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 285 

Qy 241 T GGGTGCGCCAGGT GGAC CACGT GATC GAGCGCAGC ACAGACGGGAGC AGT GGGCT GC CC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 286 T GGGTGCGCCAGGT GGACCACGT GATC GAGCGCAGCACAGACGGGAGCAGT GGGCT GCCC 345 

Qy 301 ACCATGGAGGT C CGCATTAAT GT CT CAAGGCAGC AGGT C GAGAAGGT GTT C GGGCT GGAG 360 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 346 AC CATGGAGGTC CGCATTAAT GT CT CAAGGCAGC AGGT CGAGAAGGT GTT CGGGCT GGAG 405 

Qy 361 GAATACT GGT GCCAGT GC GT GGCATGGAGCTCCTC GGGCACC ACCAAGAGT C AGAAGGC C 420 

I I I II I I I I I I I I I II I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I II I I I I I I I I I I 
Db 406 GAATACT GGT GC CAGT GCGT GGCAT GGAGCTCCTC GGGCACC ACCAAGAGT CAGAAGGC C 465 

Qy 421 T AC ATC C GCATAGC CAGATT GC GCAAGAACTT C GAGCAGGAGCCGCT GGC CAAGGAGGT G 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 1 I 
Db 466 T AC ATCCGCATAGC CAGATT GC GCAAGAACTT C GAGCAGGAGCCGCT GGC CAAGGAGGT G 525 

Qy 481 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 540 

I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 526 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 585 



Qy 



541 



GTGGAGT GGCT C C GGAACGAGGAC CT GGT GGAC CC GT CC CT GGAC CC CAAT GT AT ACAT C 600 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 



586 GT GGAGT GGCT C CGGAACGAGGAC CT GGTGGACCC GTC CCT GGAC CC CAAT GT AT ACAT C 645 



601 



646 



661 



706 



721 



766 



781 



826 



841 



886 



901 



946 



961 



ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 

TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 

GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 

GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 
I I I II I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 

T GTGAGGGGCAGAAT GT C CAGAAAACAGCCT GC GC C AC CCT GT GC CCAGT AGACGGC AGC 
I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
T GT GAGGGGCAGAAT GT C CAGAAAACAGCCT GC GC C AC CCT GT GC CCAGTAGACGGC AGC 



660 



705 



720 



765 



780 



825 



840 



885 



900 



945 



960 



TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 1005 



GAGT GCT CTGACCCAGCACC C C GCAACGGAGGGGAGGAGT GCC AGGGCACT GACCT GGAC 1020 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1006 GAGT GCT CTGAC CCAGCACC C C GCAAC GGAGGGGAGGAGT GCC AGGGCACT GAC CT GGAC 1065 

1021 ACCCGCAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

1066 ACCCGCAACT GT AC C AGT GACCT CT GT GT AC ACAGT G CTT CT GGCC CT GAGGAC GT G GC C 1125 

1081 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1140 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1126 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1185 

1141 CT CGTTTATT GC C GGAAGAAGGAGGGGCTGGACT CAGATGT GGCT GACT C GT C CATT CT C 1200 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I 

1186 CT CGT TT AT T GC C GGAAGAAGGAGGGGCTGGACT CAGATGT GGCT GACT C GT C CATT CT C 1245 

1201 ACCT C AGGCTT C CAGCCCGT CAGCAT CAAGC CC AGCAAAGC AGACAAC C C CCAT CT GCT C 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1246 ACCT CAGGCTT C CAGCCCGT CAGCAT CAAGC CC AGCAAAGC AGACAAC C C C CAT CT GCT C 1305 

1261 ACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGG 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1306 AC CAT CC AGCCGGAC CT CAGC ACCACCAC C ACC AC CT ACCAGGGCAGT CT CT GT CC CC GG 1365 

1321 CAGGATGGGCCCAGCCCCAAGTT CCAGCTCAC CAAT GGGCACCT GCT CAGCCCCCTGGGT 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

1366 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1425 

1381 GGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCC 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1426 GGCGGCCG CCACACACT GCACC ACAGCT CT C CCAC CT CT GAGGC C GAGGAGTT C GT CT C C 1485 



Qy 

Db 
Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 



1441 CGC CTCT C CAC CCAGAACT ACTT C CGCT C C CTGC C C CGAGG C AC C AGCAAC ATGAC CT AT 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1486 CGC CTCT C C AC C CAGAACT ACTT C C GCT C C CTGCC C CGAGGCAC CAGCAAC ATGAC CT AT 1545 

1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1560 

I I I I i I I I I I I I I I I I I I I I I I I I I I I II I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1546 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1605 

1561 AT CCCC C CAGAT GC CAT AC CCC GAGGGAAGAT CT AT GAGAT CT ACCT CACGCT GC ACAAG 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1606 AT CCCCCCAGAT GCCATACCCCGAGGGAAGATCTAT GAGAT CTACCT CACGCTGCACAAG 1665 

1621 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1680 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CC GGAAGACGTGAGGTT GC CCCTAGCTGGCT GT C AGAC C CT GCT GAGT C C CAT C GTT AGC 



1666 



1725 



1681 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I 1 I I I 
1726 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1785 

1741 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1786 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1845 

1801 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1846 GAGGAT GT GCT GCAC CT GGGCGAGGAGGC GCCCT CCCAC CT CT ACT ACT GCC AGCT GGAG 1905 

1861 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1906 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1965 

1921 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 1980 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1966 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 2025 

1981 T C CCTC GAGT ACAACAT CCGGGT CT ACT GC CTGCAT GACAC C CAC GATGCACT CAAGGAG 2040 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
T C CCT C GAGT ACAACAT CCGGGT CTACT GCCT GCAT GACAC CCAC GATGCACTCAAGGAG 



2026 



2085 



2041 GT GGTGCAGCT GGAGAAGCAGCT GGGGGGACAGCT GAT C CAGGAGC CAC GGGTC CT GCAC 2100 

I I I I I I I I I I II I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2086 GT GGTGCAGCT GGAGAAGCAGCTGGGGGGACAGCT GAT C CAGGAGC CAC GGGTC CT GCAC 2145 

2101 TT CAAGGAC AGTTACCACAACCT GCGCCT AT CCAT C CAC GAT GT GC CCAGCT CC CT GTGG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2146 TT CAAGGACAGTT AC CACAACCT GCGCCT AT CCAT C CAC GAT GT GCCCAGCT CC CT GT GG 2205 

2161 AAGAGTAAGCT C CTT GT C AGCT ACCAGGAGATC CCCTTT T AT CACAT CT GGAAT GGCACG 2220 

I I I I I I I I I I I.I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2206 AAGAGTAAGCT C CTT GT CAGCT ACCAGGAGATC CC CTTTT AT CACAT CT GGAAT GGCAC G 2265 

2 221 C AGCGGT ACTT.GCACTGCAC CTT CACCCT GGAGCGT GT CAGCCCCAGCACT AGTGAC CT G 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
2266 CAGC GGT ACTT GCACTGCAC CTT CACCCT GGAGC GT GT CAGCCCCAGCACT AGT GAC CT G 2325 



Qy 

Db 



2281 
2326 



GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 



2340 
2385 



Qy 2341 AACATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTC 2400 

I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2386 AACATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTC 2445 

Qy 2401 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATT 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2446 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATT 2505 

Qy 2461 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I 

Db 2506 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2565 

Qy 2521 CAC CTGGACAGCC AT CT CAGCTT CTTT GC CT CCAAGC CCAGCC C CAC AGCCAT GAT CCT C 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2566 CAC CT GGACAGC CAT CT CAGCTT CTTT GC CT CCAAGCCCAGC CCCACAGCC AT GAT C CTC 2625 

Qy 2581 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2640 

I I I I I I I II I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2626 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2685 

Qy 2641 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2697 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2686 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2742 



RESULT 2 
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DEFINITION 
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VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

FEATURES 

source 



AX451652 
Sequence 
AX451652 
AX451652. 



ORIGIN 



2697 bp 
from Patent WO0233080. 

GI:21698587 



(human) 



DNA 



linear PAT 03-JUL-2002 



Homo sapiens 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Koehler,R.H. 

Regulation of human netrin binding membrane receptor unc5h-l 
Patent: WO 0233080-A 1 25-APR-2002; 
Bayer Aktiengesellschaf t (DE) 

Location/Qualifiers 

1. .2697 

/organism= n Homo sapiens" 
/mol_type="unassigned DNA" 
/db xref="taxon:9606" 



Qy 



DB 6; Length 2697; 

6; Indels 0; Gaps 0; 
1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 



Query Match 99.6%; Score 2687.4; 

Best Local Similarity 99.8%; Pred. No. 0; 
Matches 2691; Conservative 0; Mismatches 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 

61 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 120 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I 
61 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 120 

121 GACCT GCTTCC C C ACTT C CTGGT GGAGC CCGAGGAT GT GT ACAT CGT CAAGAACAAGCCA 180 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

121 GACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATGTGTACATCGTCAAGAACAAGCCA 180 

181 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 240 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
181 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 24 0 

241 T GGGTGCGCCAGGTGGACCACGT GATCGAGCGCAGCACAGACGGGAGCAGT GGGCTGCCC 300 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
241 T GGGT GC GCCAGGT GGACCAC GT GATCGAGC GCAGCAC AGACGGGAGC AGT GGGCT GCC C 300 

301 AC CAT GGAGGT CCGCATTAAT GT CT CAAGGC AGCAGGT CGAGAAGGT GTT C GGGCT GGAG 360 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 AC CAT GGAGGT C CGCATTAAT GT CT CAAGGCAGCAGGT CGAGAAGGT GT T C GGGCT GGAG 360 

361 GAAT ACT GGT GCCAGT GCGT GGCAT GGAGCT CCT C GGGCAC CACCAAGAGT CAGAAGGC C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
361 GAAT ACT GGT GCCAGT GCGT GGCAT GGAGCT CCT CGGGCAC CACCAAGAGT CAGAAGGC C 420 

421 TACAT CCGCAT AGC CAGATT GCGCAAGAACTTCGAGCAGGAGC CGCT GGCCAAGGAGGT G 480 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
421 TACAT CC GCAT AGC CTATTT GCGCAAGAACTTCGAGCAGGAGC CGCT GGCCAAGGAGGT G 480 

481 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
481 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 540 

541 GT GGAGT GGCT CCGGAACGAGGACCT GGTGGACC C GT CCCT GGACC CCAAT GT AT ACAT C 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 GT GGAGT GGCT CCGGAACGAGGACCT GGTGGACCC GT C CCT GGACCC CAAT GT AT ACAT C 600 

601 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 660 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I 
601 ACGC GGGAGC ACAGCCT GGT GGT GCGACAGGCCC GCCTTGCTGACAC GGC CAACTACAC C 660 

661 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
661 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 720 

721 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
721 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 780 

781 GGCT GGCAGAAACGGAGCCGGAGCTGCACCAACCC GGC GCCTCTCAACGGGGGCGCTTTC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I.I I I I I I I I I I I I I I I I I 
781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 840 

841 T GT GAGGGGC AGAAT GT CCAGAAAACAGCCTGC GC CAC CCT GT GCC C AGT AGACGGC AGC 900 
I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 



Db 841 TGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTGGACGGCAGC 900 

Qy 901 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 960 

Qy 961 GAGT GCT CT GACCCAGCAC CCCGCAAC GGAGGGGAGGAGT GCCAGGGCACT GAC CT GGAC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 GAGT GCT CT GAC CC AGCAC CC CGCAAC GGAGGGGAGGAGTGCC AGGGCACT GACCT GGAC 1020 

Qy 1021 ACCC GCAACT GT ACCAGT GAC CT CT GT GTACACAGT GCTTCT GGC CCT GAGGACGT GGC C 1080 

I I I I I I I I I I I! I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I.I I I I I I I I I I I I I I 
Db 1021 ACC C GCAACT GT ACCAGT GACCT CT GT GT ACACACT GCTTCT GGC C CT GAGGACGT GGC C 1080 

Qy 1081 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1140 

I I I II II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I 
Db 1081 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1140 

Qy 1141 CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 CTCGTTTATT GC CGGAAGAAGGAGGGGCT GGACTCAGAT GT GGCT GACT CGT C CAT T CT C 1200 

Qy 1201 ACCT CAGGCT TC CAGCCC GT CAGCAT CAAGCC C AGCAAAGCAGACAAC CCCCAT CT GCT C 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 1201 ACCT CAGGCT TC CAGCCC GT CAGCAT CAAGC C CAGCAAAGCAGACAAC CCCCAT CT GCT C 1260 

Qy 1261 ACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGG 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 ACCATCCAGC CGGACCT CAGCACCAC CAC C AC CAC CTAC CAGGGCAGT CT CT GT CCC CGG 1320 

Qy 1321 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I.I I I I 
Db 1321 CAGGAT GGGC CCAGC CC CAAGT T C C AGCT CACCAAT GGGC AC CT GCT CAGC CCC CT GGGT 1380 

Qy 1381 GGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCC 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 GGC GGCC GC C ACACACT GCACCACAGCT CT CCCAC CTCT GAGGCCGAGGAGTT C GTCT C C 1440 

Qy 1441 CGC CTCT CCACC CAGAACTACTT CC GCT C C CT GCC C CGAGG CACCAGCAAC AT GACCT AT 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 CGCCTCT CCACC CAGAACTACTT C C GCT C C CT GCC CCGAGGCACCAGCAAC AT GACCT AT 1500 

Qy 1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGAATCAGCCTCCTC 1560 

Qy 1561 ATCCCCCCAGAT GC CAT ACCCCGAGGGAAGAT CT AT GAGAT CTACCT CAC GCT GCACAAG 1620 

I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 AT CC CCCCAGAT GC CAT AC CCC GAGGGAAGAT CT AT GAGAT CTACCT CAC GCT GCACAAG 1620 

Qy 1621 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1680 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 C CGGAAGAC GTGAGGTT GC CC CT AGCT GGCT GT CAGAC CCT GCT GAGT C C CAT C GT T AGC 1680 

Qy 1681 TGTGGACCCCCTGGCGTCCT GCT CACCCGGCCAGTCATCCTGGCTAT GGAC CACTGTGGG 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 TGTGGACCCCCTGGCGTCCT GCT CACCCGGCCAGTCATCCTGGCTAT GGAC CACTGTGGG 1740 



Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1741 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1800 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1741 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1800 

1801 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 18 6Q 

I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1801 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCGCTCCCACCTCTACTACTGCCAGCTGGAG 1860 

1861 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1861 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1920 

1921 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 1980 

I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1921 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 1980 

1981 TCCCTCGAGTACAACATCCGGGTCTACTGCCTGCATGACACCCACGATGCACTCAAGGAG 2040 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1981 T CCCT CGAGT ACAACAT CCGGGT CT ACT GC CT GCAT GACAC CCACGAT GCACT CAAGGAG 204 0 

2041 GT GGT GC AGCT GGAGAAGCAGCT GGGGGGACAGCT GAT CCAGGAGCCACGGGT C CT GC AC 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2041 GT GGT GCAGCT GGAGAAGCAGCT GGGGGGACAGCT GAT CCAGGAGCCACGGGT C CT GC AC 2100 

2101 TT CAAGGACAGTT ACCACAACCT GC GC CT AT C CAT CCACGATGTGCC C AGCT C C CT GT GG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2101 TT CAAGGACAGTTACCACAACCT GC GCCTATC CAT CCACGAT GT GCC CAGCT C C CT GT GG 2160 

2161 AAGAGTAAGCTCCTTGTCAGCTACCAGGAGAT CCCCTTTTATCACAT CTGGAAT GGCACG 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2161 AAGAGT AAGCT CCT T GT CAGCT AC CAGGAGAT C CCCTTTTATCACAT CT GGAAT GGCAC G 2220 

2221 CAGCGGTACTT GCACT GC ACCTT CACCCT GGAGC GT GT CAGCC C C AGCACT AGT GACCT G 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2221 CAGCGGTACTT GCACT GCACCTT CACCCT GGAGC GT GTCAGCCC C AGCACT AGT GACCT G 2280 

2281 GCCT GCAAGCT GT GGGT GT GGCAGGT GGAGGGC GAC GGGCAGAGCTT CAGCAT CAACT T C 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2281 GCCTGCAAGCTGT GGGT GT GGCAGGT GGAGGGC GAC GGGCAGAGCTT CAGCAT CAACT T C 2340 

2341 AACATCACCAAGGACACAAGGTT T GCT GAGCT GCT GGCTCT GGAGAGT GAAGC GGGGGT C 2400 
I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AACATCACCAAGGACACAAGGTT T GCT GAGCT GCT GGCTCT GGAGAGT GAAGC GGGGGT C 2400 



2341 



2401 C C AGCCCTGGT GGGC CCCAGT GC CTT CAAGAT CCCCTTCCT CAT T C GGC AGAAGATAATT 2460 

I I I I I I I I I II I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2401 C C AGCCCTGGT GGGC CC CAGT GC CTT CAAGAT C C C CTTCCT CAT T C GGC AGAAGAT AAT T 24 60 

2461 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2520 

I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2461 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2520 

2521 CAC CTGGACAGCCATCT CAGCTT CTTT GC CT CCAAGCCCAGCCCCACAGC C ATGAT CCT C 25 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2521 CACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTC 2580 



Qy 2581 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 264 0 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2581 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2640 

Qy 2641 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2697 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2641 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2697 



RESULT 3 
AX527916 

LOCUS AX527916 2881 bp DNA linear PAT 21-NOV-2002 

DEFINITION Sequence 1 from Patent WO0229038. 
ACCESSION AX527916 

VERSION AX527916.1 GI:25172359 

KEYWORDS 

SOURCE Homo sapiens (human) 

ORGANISM Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
REFERENCE 1 

AUTHORS Herrmann, J. L. , Rastelli,L. and Shimkets, R. A. 

TITLE Novel proteins and nucleic acids encoding same and antibodies 

directed against these proteins 
JOURNAL Patent: WO 0229038-A 1 ll-APR-2002; 
Curagen Corporation (US) 
FEATURES Location/Qualifiers 
source 1. .2881 

/organism="Homo sapiens" 
/mol_type=" unas signed DNA" 
/db_xref="taxon: 9606" 

ORIGIN 

Query Match 97.2%; Score 2621.4; DB 6; Length 2881; 

Best Local Similarity 98.9%; Pred. No. 0; 

Matches 2673; Conservative 0; Mismatches 21; Indels 9; Gaps 3; 

Qy 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 87 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 146 

Qy 61 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 147 C GCGGCTCGGGT GC CCAGCAGAGT GC CACCGT GGC CAACCCAGTGCCT GGT GC CAACC C G 206 

Qy 121 GACCT GCTTCCC CACTT C CT GGT GGAGC CC GAGGAT GT GT ACAT CGT CAAGAACAAGC CA 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 207 GAC CTGCTTCCC CACT T CCT GGT GGAGC C C GAGGAT GT GT ACAT CGT CAAGAACAAGCC A 266 

Qy 181 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 267 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 326 

Qy 241 TGGGT-GCGCCAGGTGGACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGGCTGCCC 300 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 327 T GGGTGCGCCAGGT GGAC CAC GT GAT C GAGC GCAGC ACAGACGGGAGCAGT GGT GAGC C G 386 



301 ACCATGGAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
387 ACC ATGGAGGTCCGCATTAAT GT CT CAAGGC AGCAGGT C GAGAAGGT GTT CGGGCT GGAG 4 46 

361 GAAT ACT GGT GC C AGT GC GT GGCAT GGAGCT CCT C GGGCAC CAC CAAGAGT C AGAAGGCC 420 

I I I I I ( I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II 
447 GAAT ACT GGT GCC AGT GCGT GGCAT GGAGCT CCT CGGGCAC CAC CAAGAGT C AGAAGGCC 506 

421 T AC ATC C GCATAGCCAGATTGC GCAAGAACTT C GAGCAGGAGCCGCT GGCCAAGGAGGT G 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
507 T AC ATC C GCATAGCCAGATT GC GCAAGAACT T C GAGC AGGAGCC GCT GGC CAAGGAGGT G 566 

481 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 54 0 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
567 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 626 

541 GT GGAGT GGCT C C GGAACGAGGAC CT GGT GGAC C CGTCC CT GGAC CCCAAT GTATACAT C 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
627 GTGGAGT GGCT C C GGAACGAGGAC CT GGT GGACC C GT CC CT GGAC CCCAAT GTATACAT C 686 

601 ACGC GGGAGCACAGC CTGGT GGT GCGACAGGC C C GC CTT GCT GAC ACGG CCAACTACAC C 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
687 ACGCGGGAGC ACAGC CT GGTGGTGC GACAGGC C CGC CTT GCT GACAC GGCCAACTACAC C 746 

661 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
747 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 806 

721 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 7 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
807 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 866 

781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

867 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 926 

841 T GTGAGGGGCAGAAT GTCCAGAA AACAGCCTGC GCCACC CT GT GCCCAGT AGAC GGC 897 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

927 TGTGAGGGGCAGAATGTCCATGACCGCACCGTCTCCTCTCTGCTTGTCTCTGTGGACGGC 986 

898 AGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGC 957 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
987 AGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGC 104 6 

958 CGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTG 1017 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1047 CGT GAGT GCT CT GAC CCAGCACC C CGCAAC GGAGGGGAGGAGT GCCAGGGCACT GACCT G 1106 

1018 GACACCCGCAACT GT ACC AGT GAC CT CT GT GT AC ACAGT GCTT CT GGC CCT GAGGACGT G 1077 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1107 GAC ACCCGCAACT GT ACCAGT GAC CT CTGT GTAC ACAGT GCTTCT GGC CCT GAGGAC GT G 1166 

1078 GCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTC 1137 

I I I I III I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1167 GCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTC 1226 

1138 ATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATT 1197 



Db 



1227 



I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II II I I I I I I I I 
ATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATT 1286 



Qy 1198 CT C AC CTCAGGCTT CCAGCCC GT C AGCAT CAAGC C C AGCAAAGCAGACAAC CCC C AT CT G 1257 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1287 CT CACCTCAGGCTT C CAGCCC GT C AGCAT CAAGC CCAGCAAAGCAGACAAC C CC CAT CT G 1346 

Qy 1258 CTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCC 1317 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1347 CT C AC CAT C CAGCCGGAC CT CAG CACCACCACCACCTACCAGGGCAGTCTCTGTCCC 1403 

Qy 1318 CGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTG 1377 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1404 CGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTG 1463 

Qy 1378 GGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTC 1437 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1464 GGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTC 1523 

Qy 1438 TCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACC 1497 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1524 TCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACC 1583 

Qy 1498 TATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTC 1557 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1584 TATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTC 1643 

Qy 1558 CTCATCCCCCCAGATGCCATACCCCGAGGGAAGATCTATGAGATCTACCTCACGCTGCAC 1617 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1644 CTCATCCCCCCAGATGCCATACCCCGAGGGAAGATCTATGAGATCTACCTCACGCTGCAC 1703 

Qy 1618 AAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTT 1677 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1704 AAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTT 1763 

Qy 1678 AGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGT 1737 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1764 AGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGT 1823 

Qy 1738 GGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGC 1797 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 1824 GGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGC 1883 

Qy 1798 TGGG AGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAG 1854 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I 
Db 1884 TGGGAGCAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAG 1943 

Qy 1855 CTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGA 1914 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 1944 CTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGA 2003 

Qy 1915 GAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCC 1974 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2004 GAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCC 2063 

Qy 1975 TGCACCTC C CT CGAGT ACAAC AT CC GGGT CT ACT GC CTGC AT GACACC C AC GAT GCACT C 2034 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 



Db 



2064 TGCACCTCCCTCGAGTACAACATCCGGGTCTACTGCCTGCATGACACCCACGATGCACTC 2123 



Qy 2035 AAGGAGGT GGT GCAGCT GGAGAAGCAGCT GGGGGGACAGCT GAT CC AGGAGC CAC GGGT C 2094 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2124 AAGGAGGTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTC 2183 

Qy 2095 CT GCACTTCAAGGACAGTTACCACAACCT GCGCCTATCCAT CCACGATGT GCCCAGCTCC 2154 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2184 CT GCACTTCAAGGACAGTTACCACAACCTGCGCCTATCCAT CCACGATGT GCCCAGCT CC 2243 

Qy 2155 CT GT GGAAGAGTAAGCT C CTTGT CAGCT AC CAGGAGAT CC CCTTT T AT C AC AT CT GGAAT 2214 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2244 CTGT GGAAGAGTAAGCT CCTTGTCAGCTACCAGGAGATCCCCTTTTATCACAT CT GGAAT 2303 

Qy 2215 GGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGT 2274 

I I I I I I I Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2304 GGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGT 2363 

Qy 2275 GACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATC 2334 

I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2364 GACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATC 2423 

Qy 2335 AACTTCAACATCACCAAGGACACAAGGTTT GCT GAGCTGCT GGCTCT GGAGAGTGAAGCG 2394 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2424 AACTT CAACATCACCAAGGACACAAGGTTT GCT GAGCT GCT GGCTCT GGAGAGTGAAGCG 2483 

Qy 2395 GGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAG 2454 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2484 GGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAG 2543 

Qy 2455 ATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAG 2514 

- I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2544 ATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAG 2603 

Qy 2515 AAACTCCACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATG 2574 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db ^ 2604 AAACTCCACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATG 2663 

Qy 2575 ATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCA 2634 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 2664 ATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCA 2723 

Qy 2635 GCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGC 2694 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2724 GC AGTGGCT GGACT GGGCCAGCCAGACGCT GGC CT CTTCACAGT GT CGGAGGCT GAGT GC 2783 

Qy 2695 TGA 2697 

III 

Db 2784 TGA 2786 
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Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Venter, C. J. , Adams, M.C., Li,P.W. and Myers, E.W. 

Kits, such as nucleic acid arrays, comprising a majority of 

humanexons or transcripts, for detecting expression and other uses 

thereof 

Patent: WO 02068579-A 16240 06-SEP-2002; 
PE Corporation (NY) (US) 

Location/Qualifiers 

1. .2784 

/organism= M Homo sapiens" 
/mol_type="unassigned DNA" 
/db xref="taxon:9606" 



Query Match 90.3%; 
Best Local Similarity 93.5%; 
Matches 2646; Conservative 



Score 2435.4; 
Pred. No. 0; 
0; Mismatches 



DB 6; Length 2784; 

6; Indels 177; Gaps 



3; 



Qy 

Db 



ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 

I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 



Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



61 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

61 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 120 

121 GACCT GCT TC CC CACTT CCT GGT GGAGCCC GAGGAT GT GT ACAT C GT CAAGAACAAGCCA 180 

I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
121 GACCT GCT TC C C CACTT CCT GGT GGAGC CC GAGGAT GT GT ACAT C GT CAAGAACAAGCCA 180 

181 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I 
181 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 240 

241 T GGGT GCGCCAGGT GGACCACGT GAT CGAGC GCAGCACAGACGGGAGCAGT GGGCT GCCC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
241 T GGGT GCGCCAGGT GGAC CACGTGATCGAGC GCAGCACAGACGGGAGC AGT GGGCT GCCC 300 

301 AC CAT GGAGGT C C GCATTAAT GT CT CAAGGCAGCAGGT CGAGAAGGT GT T C GGGCT GGAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 AC CAT GGAGGT CCGCATTAAT GT CT CAAGGCAGCAGGT C GAGAAGGT GTT C GGGCT GGAG 360 

361 GAAT ACT GGT GCCAGT GC GT GGCAT GGAGCT CCT C GGGCACCACCAAGAGT CAGAAGGC C 420 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
361 GAAT ACT GGT GCCAGTGC GTGGCAT GGAGCT CCT C GGGCACCAC CAAGAGT CAGAAGGCC 420 

421 T ACATCC GCAT AGCCAGATT GCGCAAGAACT T CGAGC AGGAGCCGCT GGCCAAGGAGGT G 480 

I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
421 T AC AT CC GCAT AGC CT AT TT GCGCAAGAACTT C GAGC AGGAGC CGCT GGC CAAG GAGGT G 480 



Qy 



481 



TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



540 



Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 
Db 



481 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 540 



541 



541 



601 



601 



661 



661 



721 



GT GGAGT GGCT C C GGAAC GAGGAC CTGGTGGAC CCGT C CCT GGAC C CCAAT GT AT AC AT C 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I 1 I I I I I I I I I 

GT GGAGT GGCT C C GGAAC GAGGAC CTGGTGGAC CCGT C CCT GGAC CC CAAT GT AT AC AT C 600 

ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 660 

TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 720 
I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 720 

720 



721 GGTGGGCCCCGGGACTCCCTGGTCACAGGGAGAGGCACTGCGGTGCCCCTGGGCAGTGAC 780 



721 



781 



754 



841 



814 



901 



874 



961 



934 



GTGAACGGTGGGTGGTCGACGTGGACCGAGTGG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ATGTGGCTGTCCTTCTCTGTCCGGCCAGTGAACGGTGGGTGGTCGACGTGGACCGAGTGG 

TCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
TCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAAC 

CCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGC 
I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGC 



753 



840 



813 



900 



873 



960 



933 



GCCACCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GCCACCCTGTGCCCAGTGGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGG 1020 



993 



CT GGACT GC ACC C ACTGGCGGAGCC GT GAGT GCT CT GAC C CAGC ACC C C GCAAC GGAGGG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 CTGGACTGCAC C CACTGGCGGAGCCGT GAGT GCT CT GACC CAGCACC C CGCAAC GGAGGG 1080 



994 



1053 



GAGGAGT GC CAGGGC ACT GACCT GGACACC C GCAACT GTACCAGT GAC CT CTGT GT ACAC 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 r 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

1081 GAGGAGT GCCAGGGCACT GACCTGGACACCCGCAACTGTACCAGTGACCT CTGTGTACAC 1140 

1054 A GTGCTTCTGGCCCT 1068 

I' I I I I I I I I I I I I I 

1141 AACTCCTACACCCCTGCCCCCACCAAGGCCATGCTGTCTCCCGCAGCTGCTTCTGGCCCT 1200 

1069 GAGGACGTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTG 1128 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 GAGGACGTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTG 1260 

1129 CTT GT CCT CAT CCT C GTTTATT GC CGGAAGAAGGAGGGGCT GGACT CAGAT GT GGCT GAC 1188 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1261 CTT GT C CT CAT CCT C GTTTATT GC CGGAAGAAGGAGGGGCT GGACT CAGAT GT GGCT GAC 1320 

1189 T CGTCCATT CT CAC CT CAGGCTT CCAGC CC GT C AGCAT CAAGC CCAGCAAAGCAGACAAC 1248 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1321 T C GT C CATTCT CAC CT CAGGCTT CCAGC CC GT C AGCAT CAAGCCC AGCAAAGCAGACAAC 1380 



Qy 
Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 
Db 



1249 CCCCATCTGCTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGT 1308 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I 

1381 CCCCATCTGCTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGT 1440 

1309 CTCTGTCCCCGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTC 1368 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1441 CTCTGTCCCCGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTC 1500 

1369 AGCCCCCTGGGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAG 1428 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1501 AGCCCCCTGGGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAG 1560 

1429 GAGTTCGTCTCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGC 1488 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1561 GAGTTCGTCTCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGC 1620 

1489 AAC AT GAC CTAT GGGACCTT CAACT TC CTC GGGGGCC GGCTGAT GATCCCT AAT ACAGGT 1548 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I II I I I I I I I I I I I I I I I I II I 

AAC AT GAC CTAT GGGAC CTT CAACTT C CT C GGGGGCC GGCTGAT GATCC CT AAT AC AGGA 1680 



1621 



1549 AT C AGC CT CCT CAT C CC C C CAGAT GCC AT AC CCCGAGGGAAGAT CTAT GAGAT CT AC CT C 1608 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1681 AT C AGC CT C CT CAT C CCC C CAGAT GC CATACCC CGAGGGAAGAT CTAT GAGAT CT AC CT C 1740 

1609 ACGCTGCACAAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGT 1668 

I I I I I I I I I I I I II I I I I I I I I I I 
1741 ACGCTGCACAAGCCGGAAGACGTG 1764 

1669 CCCATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATG 1728 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

1765 AGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATG 1815 

1729 GACCACTGTGGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGC 1788 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1816 GACCACT GT GGGGAGCCCAGCC CT GACAGCT GGAGCCTGC GC CT CAAAAAGCAGT C GT GC 1875 

1789 GAGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTAC 1848 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
1876 GAGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTAC 1935 

1849 TGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTG 1908 

I I I I I I I I I I I I I I M I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

1936 TGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTG 1995 

1909 GTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCG 1968 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I 
1996 GTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCG 2055 

1969 GT GGCCT GCAC CTC CCT C GAGT ACAACAT CCGGGTCT ACT GCCTGCAT GACAC C CAC GAT 2028 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2056 GT GGC CT GCAC CTC C CT CGAGT ACAACAT CC GGGTCT ACT GC CTGCAT GACAC C CAC GAT 2115 

2029 GCACTCAAGGAGGTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCA 2088 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2116 GCACTCAAGGAGGTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCA 2175 



Qy 

Db 



2089 
2176 



CGGGTCCTGCACTTCAAGGACAGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I M I I I II I I I I I I I II I I I I I I I I 
CGGGT C CTGCACTT CAAGGACAGTT AC CACAAC CT GCGC CT AT CCAT CCAC GAT GT GC C C 



2148 
2235 



Qy 2149 AGCT C CCTGT GGAAGAGTAAGCT CCTT GT CAGCT AC C AGGAGAT CC CCTTT T AT C ACAT C 2208 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2236 AGCT C CCT GT GGAAGAGTAAGCT CCT T GT CAGCT AC C AGGAGAT C C C CT TTT ATCACAT C 2295 

Qy 2209 TGGAATGGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGC 2268 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2296 TGGAATGGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGC 2355 

Qy 2269 ACTAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTC 2328 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2356 ACTAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTC 2415 

Qy 2329 AGCAT CAACTT CAACAT C ACCAAGGACACAAGGT TT GCT GAGCT GCT GGCT CT GGAGAGT 2388 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2416 AGCAT CAACTT CAACAT CACCAAGGAC ACAAGGT T T GCT GAGCT GCT GGCT CT GGAGAGT 2475 

Qy 2389 GAAGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGG 2448 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2476 GAAGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGG 2535 

Qy 2449 CAGAAGATAATTT C CAGCCT GGAC CCACC CT GTAGGCGGGGT GC C GACT GGCGGACT CT G 2508 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2536 CAGAAGATAATTT C CAGCCT GGAC CCACCCT GTAGGCGGGGT GC CGACT GGCGGACT CT G 2595 

Qy 2509 GCCCAGAAACT CCACCT GGACAGC C AT CT CAGCTT CTT T GC CTC CAAGC CCAGCCC CAC A 2568 

•* I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2596 GCC CAGAAACT C CACCT GGACAGC C AT CT CAGCTT CTT T GC CT C CAAGC CCAGC C CCAC A 2655 

Qy 2569 GCCATGATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTG 2628 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2656 GCCATGATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTG 2715 

Qy 2629 GCTGCAGCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCT 2688 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2716 GCTGCAGCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCT 2775 

Qy 2689 GAGTGCTGA 2697 

I I I I I I I I I 
Db 2776 GAGTGCTGA 2784 
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/organism="Homo sapiens" 
/mol_type=" unas signed DNA" 
/db_xref="taxon: 9606" 
/note="Incyte ID No: 6052371CB1" 

ORIGIN 

Query Match 86.9%; Score 2343; DB 6; Length 3580; 

Best Local Similarity 93.6%; Pred. No. 0; 

Matches 2524; Conservative 0; Mismatches 5; Indels 168; Gaps 1; 

Qy 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 63 

Qy 61 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 64 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 123 

Qy 121 GACCTGCT T CC CCACTT CCT GGT GGAGCC CGAGGAT GT GT AC AT C GT CAAGAACAAGCCA 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 124 GACCTGCT T C C C CACTT C CT GGT GGAGCC CGAGGAT GT GT ACAT C GT CAAGAACAAGCCA 183 

Qy 181 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 240 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 184 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 243 

Qy 241 T GGGTGCGC CAGGT GGAC CACGT GAT CGAGC GCAGCACAGAC GGGAGCAGT GGGCT GC CC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 244 T GGGT GCGC CAGGT GGAC CACGT GAT CGAGC GCAGCACAGAC GGGAGCAGT GGGCT GC CC 303 

Qy 301 AC CATGGAGGT C C GCATTAAT GT CT CAAGGCAGCAGGT C GAGAAGGT GTT CGGGCT GGAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 304 AC CATGGAGGT C CGCAT TAATGT CT CAAGGCAGCAGGT C GAGAAGGT GTT CGGGCT GGAG 363 

Qy 361 GAAT ACT GGT GC C AGT GC GT GGCAT GGAGCT CCT CGGGCAC CAC CAAGAGT CAGAAGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 364 GAAT ACT GGT GC CAGTGC GT GGCAT GGAGCT CCT CGGGCAC CAC CAAGAGT CAGAAGGCC 423 

Qy 421 T AC ATC C GCAT AGCCAGATT GCGC AAGAACTT CGAGCAGGAGC CGCT GGC CAAGGAGGTG 480 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I 
Db 424 TACATCCGCATAGCCTATTTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTG 483 

Qy 481 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 540 

I I I I I I I -I !! I I I I I I I I 14 I I I I I I I I I I I I I I I I I I I I I I I! I I Ull I I I I I ill I I 

Db 484 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 543 



Qy 



541 



GTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATC 



600 



1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 

Db 544 GTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATC 603 

Qy 601 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 660 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 604 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 663 

Qy 661 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 664 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 723 

Qy 721 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 780 

I I I 

Db 724 GTG 726 

Qy 781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 840 

Db 727 726 

Qy 841 TGT GAGGGGCAGAAT GT CCAGAAAACAGC CT GC GCC ACC CTGT GC CCAGT AGAC GGC AGC 900 

I I I I I I I I I 

Db 727 GACGGCAGC 735 

Qy 901 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 9 60 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 736 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 795 

Qy 961 GAGTGCTCT GACCCAGCACCC C GCAAC GGAGGGGAGGAGT GC C AGGGC ACT GAC CT GGAC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 796 GAGTGCTCT GAC CCAGCACCCC GCAAC GGAGGGGAGGAGT GCC AGGGCACT GAC CT GGAC 855 

Qy 1021 AC CCGCAACTGTAC CAGT GACCT CT GT GT ACACAGT GCTT CTGGCCCT GAGGAC GT GGC C 1080 

I I I II I I I I I I I I I II I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 856 ACCCGCAACTGTACCAGTGACCTCTGTGTACACACTGCTTCTGGCCCT GAGGAC GTGGCC 915 

Qy 1081 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I 

Db 916 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 975 

Qy 1141 CT CGTTTATTGC CGGAAGAAGGAGGGGCT GGACT CAGAT GT GGCT GACT C GT CCAT T CT C 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II 

Db 976 CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 1035 

Qy 1201 ACCTCAGGCTT CCAGCCCGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCAT CT GCT C 1260 

I I I I I I I I I I I I I I I I I I II I I II I I II II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 1036 ACCT CAGGCTT CCAGCCC GT CAGC AT CAAGC CC AGCAAAGCAGACAAC C CC CAT CT GCT C 1095 

Qy 1261 AC CAT C CAGCC GGACCT CAGC AC C AC C AC C ACC ACCT ACCAGGGC AGT CTCTGTCCCCGG 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I II I I I I II I I I I I I I I I I 

Db 1096 ACCAT CCAGCCGGACCT CAGCACCACCACCACCACCT ACCAGGGCAGTCTCT GT CCCCGG 1155 

Qy 1321 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1156 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1215 

Qy 1381 GGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCC 1440 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 



1216 GGC GGC CGC CACACACT GCAC CACAGCT CT C CCACCT CT GAGGCC GAGGAGT T C GT CT CC 1275 

1441 CGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTAT 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTAT 



1276 



1335 



1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1560 

I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

1336 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGAATCAGCCTCCTC 1395 

1561 AT CCCCCCAGAT GC CAT ACC C CGAGGGAAGAT CT AT GAGAT CT AC CT CAC GCT GC ACAAG 1620 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1396 AT CCCCCCAGAT GC CAT AC C C CGAGGGAAGATCT AT GAGAT CT AC CTCACGCT GC ACAAG 1455 

1621 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1680 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

1456 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1515 

1681 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1516 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1575 

1741 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1800 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1576 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1635 

1801 GAGGAT GT GCT GCACCTGGGC GAGGAGGCGC CCT CC CAC CTCT ACT ACT GCCAGCT GGAG 1860 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1636 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 



1695 



1861 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1920 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

1696 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1755 

1921 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 1980 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1756 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 1815 

1981 TCCCTCGAGTACAACATCCGGGTCTACTGCCTGCAT GACACCCACGATGCACT CAAGGAG 2040 

I I I I I I | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1816 TCCCT CGAGT ACAACAT CCGGGT CT ACT GCCTGCAT GACACCCAC GAT GC ACT CAAGGAG 1875 

2041 GT GGT GCAGCT GGAGAAGCAGCT GGGGGGAC AGCT GATC C AGGAGC CAC GGGT CCT GCAC 2100 

I I i 1 I I I I I I I I I I I I I I I I I I I I I t I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1876 GTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCAC 1935 

2101 TTCAAGGACAGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

1936 TT CAAGGAC AGTT ACC ACAACCT GCGCCT AT C CAT C CAC GAT GTGCCC AGCT C C CT GT GG 1995 

2161 AAGAGT AAGCT C CTT GT CAGCT AC CAGGAGAT C C CCTTT T AT CAC AT CT GGAAT GGCAC G 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AAGAGT AAGCT CCTT GT CAGCT AC CAGGAGAT C C CCTTTT AT CAC AT CT GGAAT GGC AC G 2055 



1996 



2221 



2280 



CAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTG 

i ii 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 r 1 1 ii 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

2056 CAGCGGTACTT GCACT GCACCT T CACC CT GGAGCGT GT CAGC C CCAGC ACT AGT GAC CT G 2115 



Qy 

Db 



2281 
2116 



GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 



2340 
2175 



Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



2341 AACAT CAC CAAGGACACAAGGTTT GCT GAGCT GCT GGCT CT GGAGAGT GAAGCGGGGGT C 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2176 AACATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTC 2235 

2401 CCAGC C CT GGT GGGC CC CAGT GCCT T CAAGAT CC C CTT C CTCATT C GGC AGAAGATAAT T 2460 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
C CAGCCCT GGT GGGC CC CAGT GCCTT CAAGAT CC C CTTC CT C ATT C GGCAGAAGATAAT T 



2236 



2295 



2461 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2520 
I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2355 



2296 



2521 CACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTC 2580 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTC 



2356 



2415 



2581 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 1 I I I I I I I I I I I I I I I I I I I I I I I 
2416 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2475 

2641 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2697 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2476 GCT GGACT GGGC CAGCCAGACGCT GGCCT CTTCACAGT GT CGGAGGCT GAGT GCT GA 2532 
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MMU487852 3992 bp mRNA linear ROD 24-SEP-2002 

Mus musculus mRNA for netrin receptor UncShl (UncShl gene) . 
AJ487852 

AJ487852.1 GI: 22035783 

netrin receptor Unc5hl; Unc5hl gene. 

Mus musculus (house mouse) 

Mus musculus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; Mus. 
1 

Engelkamp, D. 

Cloning of three mouse Unc5 genes and their expression patterns at 
mid-gestation 

Mech. Dev. 118 (1-2), 191-197 (2002) 

22239710 

12351186 

2 (bases 1 to 3992) 
Engelkamp, D. 
Direct Submission 

Submitted ( 15-MAY-2002 ) Neuroanatomy, Max Planck Institute for 
Brain Research, Deutschordenstrasse 46, Frankfurt 60528, GERMANY 

Location/Qualifiers 

1. .3992 

/organism="Mus musculus" 
/mol_type= ,l mRNA" 



/db_xref="taxon: 10090" 
gene 1. .3992 

/gene="Unc5hl" 
CDS 232. .2928 

/gene="Unc5hl" 

/codon_start=l 

/product="netrin receptor Unc5hl lf 

/protein_id="CAD32250. 1" 

/db_xref="GI: 22035784" 

/db_xref="GOA:Q8KlS4" 

/db_xref ="UniProt/TrEMBL : Q8K1S4 " 

/translation="MAVRPGLWPALLGIVLTAWLRGSGAQQSATVANPVPGANPDLLP 
HFLVEPEDVYIVKNKPVLLVCKAVPATQI FFKCNGEWVRQVDHVI ERSTDGSSGLPTM 
EVRIWSRQQVEKVFGLEEYWCQCVAWSSSGTTKSQKAYIRIAYLRKNFEQEPLAKEV 
SLEQGIVLPCRPPEGIPPAEVEWLRNEDLVDPSLDPNVYITREHSLVVRQARLADTAN 
YTCVAKNIVARRRSASAAVTVYVNGGWSTWTEWSVCSASCGRGWQKRSRSCTNPAPLN 
GGAFCEGQNVQKTACATLC PVDGSWS PWS KWSACGLDCTHWRS RECSDPAPRNGGEEC 
RGADLDTRNCTSDLCLHTSSGPEDVALYIGLVAVAVCLILLLLVLVLIYCRKKEGLDS 
DVADSSILTSGFQPVSIKPSKADNPHLLTIQPDLSTTTTTYQGSLCPRQDGPSPKFQL 
SNGHLLSPLGSGRHTLHHSSPTSEAEDFVSRLSTQNYFRSLPRGTSNMAYGTFNFLGG 
RLMIPNTGISLLIPPDAIPRGKIYEIYLTLHKPEDVRLPLAGCQTLLSPIVSCGPPGV 
LLTRPVTLAMDHCGEPSPDSWSLRLKKQSCEGSWEDVLHLGEESPSHLYYCQLEAGAC 
YVFTEQLGRFALVGEALSVAATKRLRLLLFAPVACTSLEYNIRVYCLHDTHDALKEW 
QLEKQLGGQLIQEPRVLHFKDSYHNLRLSIHDVPSSLWKSKLLVSYQEIPFYHIWNGT 
QQYLHCTFTLERWASTSDLACKVWWQVEGDGQSFNINFNITKDTRFAEMLALESEG 
GVPALVGPSAFKIPFLIRQKIITSLDPPCSRGADWRTLAQKLHLDSHLSFFASKPSPT 
AMILNLWEARHFPNGNLGQLAAAVAGLGQPDAGLFTVSEAEC" 

ORIGIN 

Query Match 85.2%; Score 2297; DB 10; Length 3992; 

Best Local Similarity 90.7%; Pred. No. 0; 

Matches 2447; Conservative 0; Mismatches 250; Indels 0; Gaps 0; 



Qy 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 

I I I I I I I I I I I I I I I I I I I I I.I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I ' 

Db 232 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCACTGCCTGGCTT 291 

Qy 61 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 120 

II II I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 292 CGTGGTTCGGGTGCCCAGCAGAGTGCCACAGTGGCCAACCCAGTGCCTGGTGCCAACCCA 351 

Qy 121 GAC CT GCTT CCCCACTT CCT GGT GGAGC CCGAGGAT GT GT ACATCGTCAAGAACAAGCCA 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 352 GACCT GCT GCC CCACTT CCT GGT AGAGC CGGAGGAC GT GTACATT GTCAAGAACAAGCCC 411 

Qy 181 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 240 

I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 412 GTGCTGCTGGTGTGCAAGGCTGTGCCCGCCACCCAGATCTTCTTCAAGTGCAACGGGGAA 471 

Qy 241 TGGGT GCGCCAGGT GGACCACGT GAT CGAGC GC AGCACAGAC GGGAGCAGT GGGCT GC CC 300 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 472 TGGGT T CGC CAGGT C GAT CAC GT CAT CGAAC GCAGCACT GAC GGCAGCAGC GGATT GC C A 531 

Qy 301 ACCATGGAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAG 360 

I I I I I I I I I I I II I II II II I I I I I I I I I I I I I I I I I I I I Mill I I I I I I I I I 
Db 532 ACCAT GGAGGT C CGGAT CAAC GT AT CAAGGCAGC AGGT C GAGAAAGT GTT T GGGCT GGAG 591 



361 GAATACT GGT GC CAGT GC GT GGCAT GGAGCT CCT C GGGC ACC AC CAAGAGT C AGAAGGC C 420 

II I I II I I I I I I I I I'l I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I 
592 GAGT ACT GGT GC CAGT GT GT GGCAT GGAGCT CCT CAGGAAC CACCAAAAGC CAGAAGGC C 651 

421 T ACATC CGCAT AGCCAGAT TGCGCAAGAACT TC GAGCAGGAGC C GC T GGCCAAGGAGGTG 480 

I I II I I I I II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I III 

652 T ACAT CC GGAT T GC CT AT TT GCGCAAGAACTTT GAGCAGGAGC C GCT GGCCAAGGAAGT G 711 

481 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 54 0 

II I I I I I II I II I I I I I I I I II II II II I I I II II I I I I I I I I I I III 

712 T CACTGGAGCAAGGC ATT GT GCT AC CT T GT C GC CC C CC GGAAGGAAT CC CC C CAGCT GAG 771 

541 GT GGAGT GGCT CC GGAAC GAGGACCT GGT GGAC C C GTC C CT GGAC C C CAAT GT AT AC AT C 600 

I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

772 GT GGAGT GGCT C CGAAAT GAGGACCT C GT GGACC CCT C C CT C GAC CC CAAT GT GT AC AT C 831 

601 ACGCGGGAGCACAGCCT GGT GGT GC GAC AGGCC CGCCT T GCT GACACGGC CAACT ACAC C 660 

II I I I I I I I I I I I II I II I I I I I I I I I II I I I I I II I I II I I I I I I I I I II I I 

832 AC ACGGGAGCACAGC CT AGT CGT GCGGCAGGCC CGC CT GGC CGACACT GCCAACT ACACC 891 

661 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I II I II II 
892 TGCGTGGCCAAGAACATCGTGGCCCGTCGCCGAAGCGCCTCTGCGGCCGTCATTGTTTAT 951 

721 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 780 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I 
952 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGTGCCAGCTGTGGGCGT 1011 

781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 840 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
1012 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCACCTCTCAACGGGGGCGCCTTC 1071 

841 T GT GAGGGGC AGAAT GT C CAGAAAAC AGC CT GCGCCAC C CT GT GC CC AGT AGAC GGCAGC 900 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II III 
1072 TGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCACTCTGTGCCCAGTGGATGGGAGC 1131 

901 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 960 
I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1132 T GGAGC CCATGGAGTAAGT GGT CAGCCT GCGGGCTT GACT GC AC CCACT GGC GGAGC CGG 1191 



961 GAGT GCT CT GACC CAGCAC C CCGCAACGGAGGGGAGGAGT GC CAGGGCACT GACCT GGAC 1020 
I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I III I Ml I I I I I I I 

1192 GAGTGCTCCGACCCAGCGCCCCGCAACGGAGGTGAGGAGTGCCGGGGTGCT GACCT GGAC 1251 

1021 AC C C GCAACT GT ACCAGT GACCT CT GT GT ACACAGT GCT T CT GGC C CTGAGGAC GT GGCC 1080 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1252 ACCCGCAACTGTACCAGTGACCTCTGCCTGCACACCTCTTCCGGCCCCGAGGACGTGGCT 1311 

1081 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II 

1312 CTCTACATCGGCCTCGTCGCCGTGGCCGTGTGCCTCATCTTGCTGCTGCTGGTCCTCGTC 1371 

1141 CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 1200 

III I I I I I I I I III III I I I I . I I I I I I I I I. I I I I I I II I L I U I I I I I I I 

1372 CT CAT CT ACT GC CGCAAGAAGGAAGGACT GGACT C AGAC GT GGCT GACT CAT C CAT C CTT 1431 

1201 ACCT CAGGCTT C CAGCC C GT CAGCAT CAAGCCCAGCAAAGCAGACAACC C C CAT CT GCT C 1260 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 1432 ACCT C AGGCT T CCAGCCT GT CAGCAT CAAGC CCAGCAAAG CAGACAATCC CCAT CT GCTC 1491 

Qy 1261 AC CAT C CAGC CGGAC CT CAGC AC CACCACC ACCACCT AC CAGGGC AGTCT CT GT CC C CGG 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1492 AC CATC CAAC CGGAC CT CAGCAC CACCACGACCACCT AC CAGGGC AGCCT GT GT CC C CGG 1551 

Qy 1321 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1552 CAGGATGGACCCAGCCCCAAGTT CCAGCTCTCTAAT GGT CACCTGCT CAGCCCACT GGGC 1611 

Qy 1381 GGC GGC C GCCACACACT GCAC CACAGCT CT C CCACCTCT GAGGC C GAGGAGTT CGT CT CC 1440 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1612 AGTGGCCGCCATACGCTGCACCACAGCTCCCCCACCTCTGAGGCTGAGGACTTCGTCTCC 1671 

Qy 1441 CGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTAT 1500 

I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 1672 CGCCTCTCCACCCAAAACTACTTTCGTTCTCTGCCCCGCGGTACCAGCAACATGGCCTAT 1731 

Qy 1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1732 GGGACCTT CAACTT C CT C GGGGGC C GGCT GAT GAT CCCTAAC ACAGGAAT CAGCCT C CT C 1791 

Qy 1561 AT CCCC C CAGAT GCC AT AC C CCGAGGGAAGAT CT AT GAGAT CT ACCT CAC GCTGCACAAG 1620 

II I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1792 AT AC CCC CGGAC GCCAT C C CCCGAGGAAAGATCT ACGAGATCT ACCT CACT CT GCACAAG 1851 

Qy 1621 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1680 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 1852 CCAGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCTATCGTTAGC 1911 

Qy 1681 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1740 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I III 
Db 1912 TGTGGGCCCCCAGGAGTCCTGCTCACCCGGCCAGTCATCCTT GCCAT GGACCACTGCGGG 1971 

Qy 1741 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1800 

I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 1972 GAGCCCAGTCCCGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCCTGTGAGGGCAGCTGG 2031 

Qy 1801 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 18 60 

I I I I I , I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 2032 GAGGACGT GCT GCACCTT GGTGAGGAGT C GC CCT CT CAT CT CTACT ACT GC CAGCT GGAG 2091 

Qy 1861 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1920 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2092 GCCGGGGCCTGCTATGTCTTCACCGAGCAGCTAGGCCGCTTTGCCCTGGTGGGAGAGGCC 2151 

Qy 1921 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I II I I I I I II II I I I I I I II 
Db 2152 CTCAGCGTGGCTGCCACCAAGCGCCTCAGGCTCCTTCTGTTTGCCCCTGTGGCCTGTACG 2211 

Qy 1981 T C CCT C GAGTACAACAT CCGGGT CTACT GC CT GCAT GACACC C AC GAT GCACT CAAGGAG 2040 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I 
Db 2212 T CC CT C GAGT ACAACAT CCGAGTGT ACT GC CT GCAC GAC AC C CAC GATGCT CT CAAGGAG 2271 

Qy 2041 GT GGTGC AGCT GGAGAAGCAGCT GGGGGGAC AGCT GAT C CAGGAGCC AC GGGT CCT GCAC 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I 



Db 



2272 



GTGGTGCAGCTGGAGAAGCAGCTGGGTGGACAGCTGATCCAGGAGCCCCGTGTCCTGCAC 



2331 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



2101 TTCAAGGACAGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGG 2160 
I I I I I I I I I I I I I I I I II I II I II II I I I I I I I I I I I II I II I I I I I I I I I I I I I 
TTCAAAGACAGTT AC C ACAACCT AC GT CT GT CCAT CCAC GAC GT GCC CAGCTCCCT GT GG 



2332 



2391 



2220 



2161 AAGAGTAAGCTC CTT GT CAGCT ACCAGGAGAT CCC CTTT T AT CACAT CTGGAAT GGCAC G 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Mill I I I I I I I I I I I I I I I I I 
2392 AAGAGCAAGCTCCTTGTCAGCTACCAGGAGATCCCTTTTTACCACATCTGGAATGGCACT 2451 

2221 CAGC GGT ACT TGCACT GCACCT T C ACC CT GGAGCGT GT CAGC CCCAGC ACT AGT GAC CT G 2280 

I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
2452 CAGCAGTATCTGCACTGCACCTTCACCCTGGAGCGCGTCAATGCCAGCACCAGCGACCTG 2511 

2281 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I 
GCCT GCAAGGT GT GGGTGT GGCAGGTGGAGGGAGAT GGACAGAGCTT CAACAT CAACTTT 



2512 



2571 



2341 AACATCACCAAGGACACAAGGTTT GCT GAGCT GCTGGCT CT GGAGAGT GAAGC GGGGGT C 2400 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AACATCACTAAGGACACGAGGTTT GCT GAAAT GCT GGCT CT GGAGAGT GAAGGGGGGGT C 



2572 



2631 



2401 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATT 2460 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
2632 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAAAAGATCATT 2691 

2461 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2520 
I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACCAGCCTGGACCCACCCTGCAGCCGGGGCGCCGACTGGCGAACTCTAGCCCAGAAACTT 2751 



2692 



2521 



2752 



2581 



2812 



CACCTGGACAGCCAT CTCAGCTTCTTT GC CT CCAAGCC CAGCCCCAC AGCC AT GAT CCT C 258 0 
I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CACCTGGACAGCCATCTTAGCTTCTTTGCCTCCAAGCCCAGCCCTACAGCCATGATCCTC 2811 

AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2640 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I III 
AACCTATGGGAGGCGCGGCACTTCCCCAACGGCAACCTCGGCCAGCTGGCCGCAGCTGTG 2871 



2641 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2697 

ii 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 inn 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

2872 GCCGGACTGGGC CAGC CAGAT GCT GGCCT CTT CAC C GT GTCAGAGGC C GAGTGCTGA 2928 
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15 



2697 bp 
from Patent WO0175440. 



DNA 



linear PAT 29-OCT-2001 



1 GI:16541710 



Rattus sp. 
Rattus sp. 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi; Muridae; Murinae; 
Rattus . 
1 

Cochran, S.W. , Paterson, G. Y. , Ohashi,Y.W., Morris, B.Y. and 



Pratt, J. Y. 
TITLE Schizophrenia related genes 

JOURNAL Patent: WO 0175440-A 15 ll-OCT-2001; 
WELFIDE CORPORATION (JP) 
FEATURES Location/Qualifiers 
source 1. .2697 

/ organism="Rattus sp . " 
/mol_type="unassigned DNA" 
/db_xref="taxon: 10118" 

ORIGIN 

Query Match 83.5%; Score 2252.2; DB 6; Length 2697; 

Best Local Similarity 89.7%; Pred. No. 0; 

Matches 2419; Conservative 0; Mismatches 278; Indels 0; Gaps 0; 

Qy 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGTGCTCCTGGGCATAGTCCTCGCCGCCTGGCTT 60 

Qy 61 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 120 

II II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I MINIM I I I I I I I I I I I 

Db 61 CGTGGTTCGGGTGCCCAGCAGAGTGCCACGGTGGCCAATCCAGTGCCCGGTGCCAACCCC 120 

Qy 121 GAC CTGCT T C CC CACTT CCT GGT GGAGCCCGAGGAT GT GT ACAT C GT CAAGAACAAGC CA 180 

I II I I I I I I I I I II MM I I II I I I I I Mill I II I I I II I I I I I I II I II I I I 
Db 121 GACCTGCT GC C CCACTT CCTGGT AGAGC CT GAGGAC GT GT ACAT T GT CAAGAACAAGC C G 180 

Qy 181 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 240 

III II I I I I I I M I I II I I I I I Mill I I I I I II I I I II II I I I I II I II I I 

Db 181 GTGTTGTTGGTGTGCAAGGCTGTGCCTGCCACCCAGATCTTCTTCAAGTGCAATGGGGAA 240 

Qy 241 T GGGTGCGCC AGGT GGAC CACGT GAT CGAGC GCAGCACAGACGGGAGCAGT GGGCTGCCC 300 

I M II II II II II I I II II I I I II M II I I II II I I I I I II I I I I I I 

Db 241 T GGGTCCGC C AGGT CGAT CACGTAAT TGAAC GCAGCAC CGACAGCAGCAGC GGAT T GCCA 300 

Qy 301 AC CAT GGAGGT CC GCAT TAATGT CT CAAGGCAGCAGGT CGAGAAGGT GTT C GGGCT GGAG 360 

I I I II I I II I I I II M M II II I I I I I II II I I II II I I I II I I I I I I I I I I 
Db 301 AC CAT GGAGGTCCGT AT CAACGT AT C GAGGC AGCAGGT AGAGAAAGT GTTT GGGCT GGAG 360 

Qy 361 GAAT ACT GGT GC CAGT GCGT GGCAT GGAGCT CCT CGGGCACCAC CAAGAGT CAGAAGGC C 420 

I I I II I I I I I I I II I II II I I I I II I I I I I I II I II I I II I I I I I I M M I M I M I 
Db 361 GAAT ACT GGT GC CAGTGT GT GGCAT GGAGCT CCT CGGGT AC CAC CAAAAGT CAGAAGGC C 420 

Qy 421 T ACATC CGCATAGCCAGATT GC GCAAGAACTT C GAGCAGGAGCCGCT GGC CAAGGAGGT G 480 

I II I I I I I II III I I II I II I I II I I I I I I M I I I I II II II I II I II I III 

Db 421 T ACATCCGGATT GCCTATTT GC GCAAGAACT TT GAGCAGGAGCCACT GGC CAAGGAAGTG 480 

Qy 481 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 540 

M II II I I I I II I I I II II II II II II II II II Mill II I II III 

Db 481 T CACT GGAGCAAGGCAT T GT ACT ACCTT GT C GCC C C CC AGAAGGAAT CC CCC CAGCT GAG 540 

Qy 541 GT GGAGT GGCT C CGGAAC GAGGAC CT GGT GGACC CGT CC CT GGACC C CAAT GTAT ACAT C 600 

II I II II I M I M II I I I II M I II II II II I I I I I II I I I II I I I I M I I I 

Db 541 GT GGAGT GGCT T CGAAAT GAGGACCT C GT GGACC CCT C CCT C GAT C C CAAT GT GTAC AT C 600 

Qy 601 AC GC GGGAGCACAGCCT GGT GGT GCGAC AGGCC C GC CTT GCT GACACGGC CAACT ACACC 660 

II I I I M I I I I I II I II M Mill I I I I I I I I II I II II II I I I II II II II I II 



Db 

Qy 

Db 
Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 



601 ACGCGGGAGCACAGCCTAGTCGTGCGTCAGGCCCGCCTGGCCGACACGGCCAACTACACC 660 

661 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 720 

II I I I I I I I I I I I I I I I I I II I I I I I I I I III I I I I II II I I I I I II II 

661 T GT GT GGC CAAGAACAT C GT AGC C C GT C GC C GAAGCACCT CT GCAGCGGT C ATT GTT T AT 720 

721 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I 

721 GTGAACGGTGGGTGGTCGACGTGGACTGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGT 780 

781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 1 I I I I I I I I I I I I III 

781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCACCTCTCAACGGGGGCGCCTTC 840 

841 T GT GAGGGGCAGAAT GT CCAGAAAACAGC CT GC GCCACC CT GTGC C CAGT AGAC GGCAGC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II II II I 

841 T GT GAGGGGCAGAAT GT CCAGAAAACAGC CT GCGCC ACT CT GTGC C CAGT GGAT GGGAGC 900 

901 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

901 TGGAGTTCGTGGAGTAAGTGGTCAGCCTGTGGGCTTGACTGCACCCACTGGCGGAGCCGC 960 

961 GAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTGGAC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I II I I II I I I I 

961 GAGT GCT CT GAC C CAGCAC CCC GCAAT GGAGGT GAGGAGT GT C GGGGT GCT GAC CT GGAC 1020 

1021 ACCC GCAACT GT AC CAGT GACCT CT GT GT AC AC AGT GCTT CT GGCC CT GAGGAC GT GGCC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I II I I I I I I 

1021 ACCCGCAACTGTACCAGTGACCTCTGCCTGCACACCGCTTCTTGCCCCGAGGACGTGGCT 1080 

1081 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1140 

I I I I I I Mill. I I I I I I I II II I I I I I II Mill MM I III 

1081 CTCTACATCGGCCTTGTCGCTGTGGCTGTGTGCCTCTTCTTGCTGTTGCTGGCCCTTGGA 1140 

1141 CT C GTTT AT T GC CGGAAGAAGGAGGGGCT GGACT C AGAT GT GGCT GACT C GT CCAT T CT C 1200 

III I II I II II I I I I I I I I I I I I I II I I I I II II II I I I I I I II I I I I I III 
1141 CT CATTTACT GT CGCAAGAAGGAAGGGCT GGACT C C GAT GT GGC CGACTC GT CCAT C CT C 1200 

1201 AC CT CAGGCT T CCAGCC CGT CAGCAT CAAGCCC AGCAAAGCAGACAACC CCCAT CT GCT C 1260 

II III II I I II I I II I II I I I I i I I I I I I It I I I I I I I I I I I I I I I I I I I I MUM 
1201 ACCT CGGGCTT CCAGC CT GT CAGCAT CAAGC CC AGCAAAGC AGACAACC CC CAC CT GCT C 1260 

1261 ACCATC C AGC CGGACCT CAGCAC CAC CAC CAC CAC CT AC C AGGGC AGT CT CT GT CC C CGG 1320 

II I II I II I I I I I I I I II I I I I I I I I I I I I I I M II I M II I I I I I II III I II 

1261 AC CAT C CAGCCAGACCT CAGCAC CAC CACT ACCAC CT AC C AGGGC AGTCT AT GT T C GAGG 1320 

1321 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1380 

II I I I I II I I I I I II I I I I I II II I I I I I I II I II I I II I I I I I I I I II I II II 

1321 C AGGAT GGAC C CAGCCC CAAGTT C CAGCT CT CTAAT GGT CAC CT GCT CAGC C CACT GGGG 1380 

1381 GGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCC 1440 

I I II I I II I II I I I I I II I I I I I I I I II II II I II II I II I II II II II I I I 

1381 AGT GGC CGC CAT ACGTT GCACCACAGCT CAC CCACCT CT GAGGCT GAGGACTT C GT CT C C 1440 

1441 CGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTAT 1500 

I II II I I II II II I II I I I I II II I I I I I I II II I I II I II I MM I II I II I I 

1441 CGCCTCTCCACCCAAAACTACTTTCGTTCCCTGCCCCGCGGCACCAGCAACATGGCCTAC 1500 



Qy 1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1560 

11 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M II I I I I I I I I I I I I 
Db 1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACGGGGATCAGCCTCCTC 1560 

Qy 1561 AT CCCC C CAGAT GC CAT ACC CC GAGGGAAGAT CTAT GAGAT CTAC CT C AC GCT GC ACAAG 1620 

II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 1561 AT AC CC CCGGAT GCC AT C C C C C GAGGAAAGAT CTAC GAGAT CTACCT C ACACT GCACAAG 1620 

Qy 1621 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1680 

II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1621 CCAGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCAGTCGTTAGC 1680 

Qy 1681 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1740 

I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 1681 TGTGGGCCCCCAGGAGTCCTGCTCACCCGGCCAGTCATCCTTGCAATGGACCACTGTGGA 1740 

Qy 1741 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1800 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 1741 GAGCCCAGCC CT GACAGCT GGAGT CT GCGC CT CAAAAAGCAGT CCT GC GAGGGCAGT T GG 1800 

Qy 1801 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1860 

I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1801 GAGGAT GTGCT GCAC CT T GGT GAGGAGT CACCTTC C CAC CT CTACTACT GC CAGCT GGAG 1860 

Qy 1861 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1920 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 1861 GCCGGGGCCTGCTATGTCTTCACGGAGCAGCTGGGCCGCTTTGCCCTGGTAGGAGAGGCC 1920 

Qy 1921 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 198 0 

II I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I II I I I I I I I I II 

Db 1921 CTCAGCGTGGCTGCCACCAAGCGCCTCAGGCTCCTTCTGTTTGCTCCCGTGGCCTGTACG 1980 

Qy 1981 T CC CT C GAGT ACAACAT C CGGGT CT ACT GCCT GC AT GACACC CAC GAT GCACT CAAGGAG 2040 

1111111111111111111 II II I I I I I I II I I I I I I I II I I II I I I I I I I I I 
Db 1981 T CC CTT GAGT ACAACAT C CGAGT GT ACT GCCTACAC GACACCCAC GAC GCT CT CAAGGAG 2 04 0 

Qy 2041 GTGGTGCAGCTGGAGAAGCAGCT GGGGGGACAGCT GAT C CAGGAGCCAC GGGT CCT GCAC 2100 

I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 2041 GT GGTGCAGCTGGAGAAGCAGCTAGGT GGAC AGCT GAT C CAGGAGCCT CGC GT CCT GCAC 2100 

Qy 2101 TTCAAGGACAGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGG 2160 

I I I II I I.I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 TTCAAAGACAGTT ACCACAAC CT ACGT CT CT C CAT C CAC GAC GT GCCC AGCT CC CT GT GG 2160 

Qy 2161 AAGAGTAAGCT CCTT GT CAGCT AC C AGGAGAT CC C CTTT T AT CACAT CT GGAAT GGCAC G 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Mill 
Db 2161 AAGAGCAAGCT ACTT GT CAGCT AC C AGGAGAT C C CT TTT TAC CACAT CT GGAAC GGCAC C 2220 

Qy 2221 CAGC GGT ACTT GCACT GCACCTT CAC C CT GGAGC GT GT CAGCCC CAGCACT AGTGACCT G 2280 

I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I II I I I I I I 
Db 2221 C AGCAGT AT CTGCACT GCACCTT CAC CCT GGAGC GCAT CAACGC CAGCAC C AGCGAC CT G 2280 

Qy 2281 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 GCCT GCAAGGTGT GGGTGTGGCAGGTGGAGGGAGAT GGGCAGAGCTTCAACATCAACTT C 2340 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 



2341 AACATCACCAAGGAC ACAAGGTTT GCTGAGCTGCT GGCT CT GGAGAGT GAAGC GGGGGT C 24 00 

I I I I I I I I I I I I I I I I I I I I I I I ! I I I I II I I I I I I I I I I I II I I I I I I I I I I I I 

2341 AACATCACTAAGGACACAAGGTTTGCTGAATTGTTGGCTCTGGAGAGTGAAGGGGGGGTC 2400 

2401 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATT 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

2401 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAAAAGATCATC 2460 

2461 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2520 

I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

2461 GCCAGTCTGGACCCACCCTGCAGCCGGGGCGCCGACTGGAGAACTCTAGCCCAGAAACTT 2520 



2521 



2521 



2581 



CAC CT GGAC AGC C AT CT CAGCTT CTTTGCCT CCAAGC CC AGC C C CAC AGC CAT GAT C CTC 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

CAC CT GGACAGC CAT CTT AGCT T CTTT GC CT CCAAGCC C AGC CCT AC AGC CAT GAT C CTC 2580 



AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2640 

I I II I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Mill III 
2581 AACCTATGGGAGGCACGGCACTTCCCCAACGGCAACCTCGGCCAGCTGGCAGCAGCTGTG 2640 

2641 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2697 

II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I III 
2641 GC CGGACT GGGCCAACCAGAT GCT GGCCT CTTCACGGT GT C GGAGGC CGAGT GTT GA 2697 



RESULT 8 
RNU87305 
LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 

TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 

TITLE 
JOURNAL 

FEATURES 

source 



RNU87305 2697 bp mRNA linear ROD 15-MAY-1997 

Rattus norvegicus transmembrane receptor Unc5Hl mRNA, complete cds . 
U87305 

U87305.1 GI:2055391 

Rattus norvegicus (Norway rat) 
Rattus norvegicus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; 
Rattus . 

1 (bases 1 to 2697) 

Leonardo, E. D. , Hinck,L., Masu,M., Keino-Masu, K. , Ackerman, S . L. and 
Tessier-Lavigne, M. 

Vertebrate homologues of C* elegans UNC-5 are candidate netrin 
receptors 

Nature 386 (6627), 833-838 (1997) 

97271897 

9126742 

2 (bases 1 to 2697) 

Leonardo, E. D. , Hinck,L., Masu,M., Keino-Masu, K. and 

Tessier-Lavigne,M. 

Direct Submission 

Submitted (28- JAN-1997 ) Anatomy, UCSF, 513 Parnassus, San 
Francisco, CA 94143-0452, USA 

Location/Qualifiers 

1. .2697 

/organism="Rattus norvegicus " 
/mol_type="mRNA" 
/db_xref="taxon: 10116" 

/tissue_type="brain and ventral spinal cord" 



/dev_stage="18 day embyo and 13 day embryo" 
CDS 1. .2697 

/ codon_start=l 

/product=" transmembrane receptor UNC5H1" 
/protein_id="AAB57678 . 1" 
/db_xref ="GI : 2055392 " 

/translation="MAVRPGLWPVLLGIVLAAWLRGSGAQQSATVANPVPGANPDLLP 
HFLVEPEDWIVKNKPVLLVCKAVPATQIFFKCNGEWVRQVDHVIERSTDSSSGLPTM 
EVRINVSRQQVEKVFGLEEYWCQCVAWSSSGTTKSQKAYIRIAYLRKNFEQEPLAKEV 
SLEQGIVLPCRPPEGIPPAEVEWLRNEDLVDPSLDPNVYITREHSLVVRQARLADTAN 
YT CVAKN I VARRRS T S AAVI VYVNGGWSTWT EWS VC S AS CGRGWQKRS RS CTN PAP LN 
GGAFCEGQNVQKTACATLCPVDGSWSSWSKWSACGLDCTHWRSRECSDPAPRNGGEEC 
RGADLDTRNCTSDLCLHTASCPEDVALYIGLVAVAVCLFLLLLALGLIYCRKKEGLDS 
DVADSSILTSGFQPVSIKPSKADNPHLLTIQPDLSTTTTTYQGSLCSRQDGPSPKFQL 
SNGHLLSPLGSGRHTLHHSSPTSEAEDFVSRLSTQNYFRSLPRGTSNMAYGTFNFLGG 
RLMIPNTGISLLIPPDAIPRGKIYEIYLTLHKPEDVRLPLAGCQTLLSPWSCGPPGV 
LLTRPVIIxAMDHCGEPSPDSWSLRLKKQSCEGSWEDVLHLGEESPSHLYYCQLEAGAC 
YVFTEQLGRFALVGEALSVAATKRLRLLLFAPVACTSLEYNIRVYCLHDTHD.ALKEW 
QLEKQLGGQLIQEPRVLHFKDSYHNLRLSIHDVPSSLWKSKLLVSYQEIPFYHIWNGT 
QQYLHCTFTLERINASTSDIACKVWVWQVEGDGQSFNINFNITKDTRFAELLALESEG 
GVPALVGPSAFKIPFLIRQKIIASLDPPCSRGADWRTLAQKLHLDSHLSFFASKPSPT 
AMI LNLWEARH FPNGNLGQLAAAVAGLGQ P DAGL FTVS EAEC " 

ORIGIN 

Query Match 83.5%; Score 2252.2; DB 10; Length 2697; 

Best Local Similarity 89.7%; Pred. No. 0; 

Matches 2419; Conservative 0; Mismatches 278; Indels 0; Gaps 0; 

Qy 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGTGCTCCTGGGCATAGTCCTCGCCGCCTGGCTT 60 

Qy 61 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 12 0 

II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 CGTGGTTCGGGTGCCCAGCAGAGTGCCACGGTGGCCAATCCAGTGCCCGGTGCCAACCCC 120 

Qy 121 GAC CT GCTT C CCCACTT CCT GGT GGAGCCCGAGGAT GTGTACAT C GT CAAGAACAAGC CA 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I 
Db 121 GAC CT GCT GCCCCACTT CCT GGT AGAGCCT GAGGAC GTGTACATT GT CAAGAACAAGC CG 180 

Qy 181 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 240 

III II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 GTGTTGTTGGTGTGCAAGGCTGTGCCTGCCACCCAGATCTTCTTCAAGTGCAATGGGGAA 240 

Qy 241 T GGGT GC GC CAGGT GGACCAC GT GAT CGAGCGCAGCACAGAC GGGAGCAGT GGGCT GC CC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 TGGGT CCGCCAGGT CGAT CACGTAATTGAACGCAGCACCGACAGCAGCAGCGGATT GCCA 300 

Qy 301 ACCATGGAGGTC C GC ATTAAT GT CT CAAGGC AGCAGGT CGAGAAGGT GTTCGGGCTG GAG 360 

I I I I I I I I I I I I I I II II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 AC CAT GGAGGT CCGT AT CAACGT AT CGAGGCAGCAGGT AGAGAAAGT GTT T GGGCT GGAG 360 

Qy 361 GAAT ACT GGT GCCAGTGC GT GGCAT GGAGCT CCT C GGGCAC CACCAAGAGT CAGAAGGC C 420 

III I I I II II I II II I I II 111 II I I I III I I II I II II III I I I II II I I II! II I 

Db 361 GAAT ACT GGT GC C AGTGT GT GGCAT GGAGCT CCT C GGGT ACCACCAAAAGT CAGAAGGCC 420 



Qy 



421 T AC AT CC GCAT AGC CAGATT GC GCAAGAACTT C GAGCAGGAGCC GCT GGCCAAGGAGGTG 480 



Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 
Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 



I I I 1 1 1 1 I 1 1 III I I 1 1 1 1 I 1 1 1 1 1 1 1 I II II I 1 1 1 I I I I 1 1 I I I 1 1 I I III 

421 TACAT CC GGATT GCCT ATTT GCGCAAGAACT TT GAGCAGGAGCCACT GGC CAAGGAAGT G 480 

481 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 540 

II I I I I I I I I I I I I I II II II I I I I II II II II Mill I I I I I III 

481 T CACTGGAGCAAGGC ATT GT ACT AC CTT GT C GCC C C CCAGAAGGAAT CCCC C C AGCT GAG 540 

541 GT GGAGT GGCT CC GGAACGAGGAC CT GGT GGACC CGTC C CT GGACC C CAAT GT AT AC AT C 600 

I I I II I I I I I I II II I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
541 GT GGAGT GGCT T C GAAAT GAGGACCT C GT GGAC CCCTCCCTC GAT CC CAAT GT GT ACAT C 600 

601 AC GC GGGAGCACAGC CT GGT GGT GCGACAGGCC C GCCT T GCT GAC AC GGC CAACT ACAC C 660 

I I II I I II I I I I I I I I I M I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

601 ACGCGGGAGCACAGCCTAGTCGTGCGTCAGGCCCGCCTGGCCGACACGGCCAACTACACC 660 

661 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 720 

II I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I II II Mill II II 

661 TGTGTGGCCAAGAACATCGTAGCCCGTCGCCGAAGCACCTCTGCAGCGGTCATTGTTTAT 720 

721 GTGAACGGTGGGT GGT CGACGT GGACC GAGT GGT CCGTCTGCAGCGCCAGCTGTGGGCGC 780 

II II M I M II I I I II I I I I I I I I II I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I 
721 GTGAACGGTGGGT GGT CGACGTGGACT GAGT GGT CCGTCTGCAGCGCCAGCTGTGGGCGT 780 

781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 840 

M II M I I I II I II I I II I I I I I I II I I II II II I I I I I I II I M M II M I I I I Ml 

781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCACCTCTCAACGGGGGCGCCTTC 840 
841 T GT GAGGGGCAGAAT GT CCAGAAAACAGC CT GCGC C ACCCT GT GC C C AGTAGAC GGC AGC 900 

II M M I M II I II II I I I I I I I I II I I II M I I I I I I I I M II M I II II II Ml 

841 T GT GAGGGGCAGAAT GT CCAGAAAACAGC CT GCGC C ACT CT GT GC C C AGT GGAT GGGAGC 900 

901 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 960 

Mill M I II II I II I I I I I II I I II I I II I I I M I II I I II I II II II I M II 
901 TGGAGTTCGT GGAGT AAGT GGT CAGCCTGTGGGCTTGACTGCACCCACTGGCGGAGCCGC 960 

961 GAGT GCT CT GAC CCAGCACCCCGCAAC GGAGGGGAGGAGT GC CAGGGCACT GAC CT GGAC 1020 

I II I II I II II I I I I I I I I I I I I I II II I I I I I II I II I I III II II M II I II 

961 GAGT GCT CT GAC CCAGCACC CCGCAAT GGAGGT GAGGAGT GT CGGGGT GCT GAC CT GGAC 1020 

1021 AC C C GCAACT GT ACCAGT GACCT CT GT GT ACACAGT GCTT CT GGCC CT GAGGAC GT GGCC 1080 

II II M I II II I II I I II I I I I I I II I I I I I MUM I I II I I M I II II I I 

1021 AC C C GCAACT GT ACCAGT GACCT CT GC CT GCACAC C GCTT CT T GCC C CGAGGAC GT GGCT 1080 

1081 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1140 

II II I I I II II I I I I I I I I I II II II I I I I II I I II II I I II 

1081 CTCTACATCGGCCTTGTCGCTGTGGCTGTGTGCCTCTTCTTGCTGTTGCTGGCCCTTGGA 1140 

1141 CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 1200 

III I I II II II II II II M I I II I M I II I I I II I I I I II I II II II I I III 
1141 CT CATTT ACT GT C GCAAGAAGGAAGGGCT GGACT C C GAT GT GGCC GACT C GT CC AT C CT C 1200 

1201 ACCT CAGGCTT CCAGCC C GT CAGCAT CAAGC CCAGCAAAGCAGACAACC C C CAT CT GCT C 1260 

I II I I I I I I I I II I II I I I II II II II I I I I II II I II I I I I I II I I M II I I I I II 
1201 ACCTCGGGCTTCCAGCCTGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCACCTGCTC 1260 

1261 AC CAT CC AGC CGGAC CT C AGCACC ACCACC ACCAC CTAC CAGGGC AGTCT CT GT CC CC GG 1320 

II II II M I I I I I I I I I I II I I I II I I I I I I I I I I I I M I II I I I I I I III I II 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1261 AC CAT C CAGCC AGACCT CAGCAC CAC C ACT ACC ACCT AC CAGGGCAGT CT AT GTT C GAGG 1320 

1321 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1380 

I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1321 CAGGATGGACCCAGCCCCAAGTTCCAGCTCTCTAATGGTCACCTGCTCAGCCCACTGGGG 1380 

1381 GGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCC 1440 

I I I I I I I I I II I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I 

1381 AGTGGCCGCCATACGTTGCACCACAGCTCACCCACCTCTGAGGCTGAGGACTTCGTCTCC 1440 

1441 C GC CTCTCCAC CCAGAACT ACTT CCGCT CCCTGCCCC GAGGC ACC AGCAAC AT GAC CT AT 1500 

I I I I I I I I I I I I I I MINIM II I I I I I I I II I I I I I I I M I I II I I I I I I I I 

1441 CGCCTCTCCACCCAAAACTACTTTCGTTCCCTGCCCCGCGGCACCAGCAACATGGCCTAC 1500 

1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1560 

I I I I I I II I I I I I II I I II I I I I I II I I I II I M I I I I II I I I I II I I II II I I I II I 
1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACGGGGATCAGCCTCCTC 1560 

1561 ATCCCCCCAGATGCCATACCCCGAGGGAAGATCTATGAGATCTACCTCACGCTGCACAAG 1620 

II Mill I II I I I I I I I I I I I II I I II I I I I I II I I I I I M I I I I I II I II I I I 

1561 AT ACCCCCGGAT GCCAT C CCC C GAGGAAAGAT CT AC GAGATCT AC CTCACACT GCACAAG 1620 

1621 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1680 

II II I I I M I I I I I I I I I I II I II I II I I I I I I I I I II I I I I I II I I I I I II I I I I I 

1621 CCAGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCAGTCGTTAGC 1680 

1681 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 174 0 

I I I II I I II I II I I II I I I I I I I I I I I I I I I I I I II I I II I I I M II I II II I I 

1681 TGTGGGCCCCCAGGAGTCCTGCTCACCCGGCCAGTCATCCTTGCAATGGACCACTGTGGA 174 0 

1741 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1800 

I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I M I I I I II II III 

1741 GAGCCCAGCCCTGACAGCTGGAGTCTGCGCCTCAAAAAGCAGTCCTGCGAGGGCAGTTGG 1800 

1801 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1860 

I I I I II I I I I I I I I I I I II II I II I I II I M I I I I I I II I I I I I II I II II I I I I 

1801 GAGGAT GT GCT GCACCTT GGT GAGGAGT CACCTT CC CAC CTCT ACT ACT GC CAGCTGGAG 1860 

1861 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1920 

III I MINIM I I I I II I I II I II I I II I I I I I I I I II I I II I I I I I I I I I I II 
1861 GCCGGGGCCTGCTATGTCTTCACGGAGCAGCTGGGCCGCTTTGCCCTGGTAGGAGAGGCC 1920 

1921 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 1980 

I I I I II II II I I II I I I I I II I I I I II III N I I I I I II I I II I I I I I I II II 

1921 CTCAGCGTGGCTGCCACCAAGCGCCTCAGGCTCCTTCTGTTTGCTCCCGTGGCCTGTACG 1980 

1981 TCC CT CGAGT ACAACAT C C GGGT CT ACT GC CT GCAT GAC ACC CACGAT GCACT CAAGGAG 2040 

I I I II I II I I II I I I I I I I II I I I I I I I I II I I I I II I I I I I II MINIMI 

1981 TCCCTT GAGT ACAACAT C C GAGT GT ACT GCCT ACAC GAC ACC CAC GAC GCT CT CAAGGAG 2040 

2041 GT GGT GCAGCT GGAGAAGCAGCT GGGGGGACAGCTGAT CCAGGAGC CAC GGGTC CTGCAC 2100 
I M I M I M I I I M I I I I M M I II I I I I N II I I II I I II II I I II I I I I I II I I 

2041 GT GGT GCAGCT GGAGAAGCAGCT AGGT GGACAGCT GAT C CAGGAGCCT CGC GT C CT GC AC 2100 

2101 TT CAAGGACAGTT AC CACAAC CT GCGC CT AT CCATC CACGAT GT GC CC AGCT CC CT GT GG 2160 

I I I I I I I I I II I N I II I I II I II II I I I I I I II I I I I II I I I I II I I I I I II I I 

2101 TT CAAAGACAGTT AC CACAACCT ACGT CTCT CCATC CAC GACGTGCCC AGCT CC CT GT GG 2160 



Qy 

Db 



2161 
2161 



AAGAGTAAGCT C CTT GT CAGCT AC CAGGAGAT C CC CTTTT AT CACAT CT GGAAT GGC ACG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
AAGAGCAAGCTACTT GT CAGCT AC CAGGAGAT CC CTTTTT AC CACATCT GGAAC GGCACC 



2220 
2220 



Qy 2221 CAGCGGT ACTT GCACT GCACCTT CAC C CT GGAGC GT GT CAGCCCC AGCACT AGT GAC CTG 2280 

I I I I III I I I I I I I I I I I I I II I I I I I I I I I I III I I I I I I I I II I I I I I I 
Db 2221 CAGCAGT AT CTGC ACT GCACCTT CACCCT GGAGCGC AT CAAC GC C AGCAC CAGCGACCTG 2280 

Qy 2281 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2340 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I 

Db 2281 GCCT GCAAGGTGTGGGT GT GGCAGGT GGAGGGAGAT GGGCAGAGCTTCAACATCAACTTC 2340 

Qy 2341 AACATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTC 2400 

II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2341 AACATCACTAAGGACACAAGGTTTGCT GAATTGTT GGCT CT GGAGAGTGAAGGGGGGGT C 2400 

Qy 2401 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAQATCCCCTTCCTCATTCGGCAGAAGATAATT 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 
Db 2401 CCAGCCCT GGT GGGCCCCAGTGCCT T CAAGATCC C CT T C CT CATT C GGCAAAAGAT CAT C 2460 

Qy 2461 T CCAGCCT GGAC C CACC CT GTAGGC GGGGT GCC GACT GGC GGACT CT GGC C CAGAAACT C 2520 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2461 GCCAGTCTGGACCCACCCTGCAGCCGGGGCGCCGACTGGAGAACTCTAGCCCAGAAACTT 2520 

Qy 2521 CACCT GGAC AGCCAT CT C AGCTT CTTT GC CT CCAAGCC CAGC CCCACAGC CATGAT C CT C 2580 

I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 CACCT GGACAGCCAT CTT AGCTT CTTT GC CT CCAAGCC CAGC C CTACAGC CATGAT C CT C 2580 

Qy 2581 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2640 

I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 2581 AACCTATGGGAGGCACGGCACTTCCCCAACGGCAACCTCGGC CAGCT GGCAGCAGCTGTG 2640 

Qy 2641 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2697 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 2641 GC C GGACTGGGCCAACCAGATGCT GGCCT CTT CAC GGT GT C GGAGGCCGAGT GT T GA 2697 



RESULT 9 
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LOCUS 

DEFINITION 
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KEYWORDS 
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COMMENT 



BD057524 3014 bp DNA 

Netrin receptors . 

BD057524 

BD057524. 1 GI: 22603130 
JP 2001505062-A/l. 
synthetic construct 
synthetic construct 

other sequences; artificial sequences. 
1 (bases 1 to 3014) 

Lavigne,M.T. , Leonardo, D. E. , Hinck,L. , 
Netrin receptors 

Patent: JP 2001505062-A 1 17-APR-2001; 

THE REGENTS OF THE UNIV OF CALIFORNIA 

PN JP 2001505062-A/l 

PD 17-APR-2001 

PF 19-FEB-1998 JP 1998536840 

PR 19-FEB-1997 US 08/808982 



linear PAT 27-AUG-2002 



Masu,M. and Masu,K.K. 



PI MARC TESSIER LAVIGNE, DAVID E LEONARDO, LINDSAY HINCK, MASAYUKI 
PI MASU, 

PI KAZUKO KEINO MASU 

PC C07Kl/00,C07K14/00,C07K17/00,C07H21/02 / C07H21/04 / G01N33/53 CC 

Strandedness : Double; 
CC Topology: Linear; 

FH Key Location/Qualifiers. 
FEATURES Location/Qualifiers 
source 1. .3014 

/organism="synthetic construct" 
/mol_type=" genomic DNA" 
/db_xref="taxon: 32630" 

ORIGIN 

Query Match 83.5%; Score 2252.2; DB 6; Length 3014; 

Best Local Similarity 89.7%; Pred. No. 0; 

Matches 2419; Conservative 0; Mismatches 278; Indels 0; Gaps 0; 



Qy 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I 

Db 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGTGCTCCTGGGCATAGTCCTCGCCGCCTGGCTT 60 

Qy 61 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 120 

I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 CGTGGTTCGGGTGCCCAGCAGAGTGCCACGGTGGCCAATCCAGTGCCCGGTGCCAACCCC 120 

Qy 121 GAC CTGCTTCCC CACTTCCT GGT GGAGCC CGAGGAT GT GT ACAT C GT CAAGAACAAGC CA 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 GACCT GCT GC CC CACTT CCT GGT AGAGC CT GAGGACGT GT ACAT T GT CAAGAACAAGCCG 180 

Qy 181 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 240 

III II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 GTGTTGTTGGTGTGCAAGGCTGTGCCTGCCACCCAGATCTTCTTCAAGTGCAATGGGGAA 240 

Qy 241 T GGGT GC GCCAGGT GGAC CACGT GAT CGAGCGCAGC ACAGAC GGGAGCAGT GGGCT GC CC 300 

I I I I I I I I I I I I I I I I I LI I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 T GGGTCCGC CAGGT CGAT CAC GT AATTGAAC GCAGCACC GAC AGCAGCAGCGGAT T GC CA 300 

Qy 301 ACCATGGAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAG 360 

I III I HI I I I I I I II II II I I I I I It I I I I I I I I II I I I I I I I I I I I I I I I 
Db 301 AC CATGGAGGTCC GT AT CAAC GT AT CGAGGCAGC AGGT AGAGAAAGT GT TT GGGCT GGAG 360 

Qy 361 GAAT ACT GGT GC CAGT GCGT GGCAT GGAGCT CCT CGGGCAC CACCAAGAGT C AGAAGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I MINIM I I II I Ml I I I I 
Db 361 GAAT ACT GGT GCCAGTGT GT GGCAT GGAGCT CCT C GGGT AC CAC CAAAAGT CAGAAGGCC 420 

Qy 421 T ACATC C GC ATAGC CAGAT T GC GCAAGAACTTC GAGCAGGAGCC GCT GGC CAAGGAGGT G 480 

I I I I I I I I II III I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 421 T AC AT CCGGATT GCCTATTT GCGCAAGAACT TT GAGCAGGAGC C ACT GGC CAAGGAAGTG 480 

Qy 481 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 
Db 481 T C ACTGGAGCAAGGCATT GT ACT AC CTT GT CGC C C C C CAGAAGGAAT CCC CCC AGCT GAG 540 



Qy 

Db 



541 
541 



600 



600 



Qy 601 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 660 

I I I I I I I II I I I I I I I I II I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 601 AC GC GGGAGC ACAGC CT AGT CGT GC GT CAGGC CCGC CT GGCCGAC AC GGC CAACT AC AC C 660 

Qy 661 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 720 

II I I I I I I I I I I I I I I I I I II I I I I I I I I III INI II II I I I I I II II 

Db 661 T GTGT GGCCAAGAAC AT CGT AGC CC GT C GC CGAAGC AC CT CT GCAGC GGT CAT T GTT T AT 720 

Qy 721 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 7 80 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 GTGAACGGTGGGTGGTCGACGTGGACTGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGT 780 

Qy 781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 840 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCACCTCTCAACGGGGGCGCCTTC 84 0 

Qy 841 T GT GAGGGGC AGAAT GT C C AGAAAACAGC CT GC GC CACC CTGT GCC C AGT AGAC GGC AGC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II III 

Db 841 T GT GAGGGGCAGAAT GT CCAGAAAACAGC CT GCGC CACT CTGT GCCCAGT GGAT GGGAGC 900 

Qy 901 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 901 TGGAGTTCGTGGAGTAAGTGGTCAGCCTGTGGGCTTGACTGCACCCACTGGCGGAGCCGC 960 

Qy 961 GAGT GCTCT GACCCAGC AC CC CGCAAC GGAGGGGAGGAGT GCC AGGGCACT GACCT GGAC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 961 GAGT GCTCT GACCCAGCACCC CGCAAT GGAGGT GAGGAGT GT C GGGGT GCT GACCTGGAC 1020 

Qy 1021 AC CCGCAACT GT ACCAGTGAC CTCT GT GT AC ACAGT GCTT CT GGCC CT GAGGACGT GGC C 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I U I I I I I I I I I I I I I I I I I I I I I 

Db 1021 ACCCGCAACTGTACCAGTGACCTCTGCCTGCACACCGCTTCTTGCCCCGAGGACGTGGCT 1080 

Qy 1081 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1081 CTCTACATCGGCCTTGTCGCTGTGGCTGTGTGCCTCTTCTTGCTGTTGCTGGCCCTTGGA 1140 

Qy 1141 CT C GT TT ATT GCC GGAAGAAGGAGGGGCT GGACT CAGAT GTGGCTGACT C GT C CATT CT C 1200 

III I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 1141 CT CAT T T ACT GT C GCAAGAAGGAAGGGCT GGACT C CGAT GTGGC CGACT C GT C CAT C CT C 1200 

Qy 1201 AC CT CAGGCTT CCAGC C CGT CAGC AT CAAGC CCAGCAAAGCAGACAACC C C C AT CT GCT C 1260 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1201 ACCTCGGGCTTCCAGCCTGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCACCTGCTC 1260 

Qy 1261 AC CAT C CAGC CGGAC CT CAGC AC C ACC ACCAC CAC CT ACC AGGGCAGT CTCTGTCCCCGG 1320 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I III I II 

Db 1261 AC CAT CCAGC CAGAC CT CAGCAC CAC CACT ACCAC CTAC CAGGGCAGT CT ATGTT CGAGG 1320 

Qy 1321 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 1321 C AGGAT GGAC CCAGC CC CAAGTT C C AGCT CT CTAAT GGT CAC CT GCT CAGC CCACTGGGG 1380 

Qy 1381 GGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCC 1440 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1381 AGTGGCCGCCATACGTTGCACCACAGCTCACCCACCTCTGAGGCTGAGGACTTCGTCTCC 1440 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Pb 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 



1441 C GCCTCT C C ACCC AGAACTACT T CC GCT C C CT GC C CC GAGGCAC CAGCAAC AT GAC CT AT 1500 

I I I I I I I I I I I I I I MINIM M M M M M M I M II M I M I M M I MM 

1441 CGCCTCTCCACCCAAAACTACTTTCGTTCCCTGCCCCGCGGCACCAGCAACATGGCCTAC 1500 
1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1560 

M I M M M M M M M M M M M II M M M M M M M II I II I I I I II I II I M 

1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACGGGGATCAGCCTCCTC 1560 

1561 AT C C CCCCAGAT GC CATACC CCGAGGGAAGATCT AT GAGAT CT ACCT CAC GCT GCACAAG 1620 

II I II I I I I II II I I II II I II I II I I I I II II II II II I I II I I I I II II II I 
1561 AT AC CCC C GGAT GC CAT C CC CCGAGGAAAGATCT AC GAGAT CT AC CT CAC ACT GCACAAG 1620 

1621 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1680 

II I M M I II II I M I I II M M I I I II I II I M I I II II M I M I II I I II M II I 

1621 C CAGAAGAC GT GAGGTT GCC C CT AGCT GGCT GT CAGACC CT GCT GAGT C CAGT C GTT AGC 1680 

1681 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1740 

Mill I I I II II I I II I II II I II I M I I II I I I I I II II I II I II I I I I II II 
1681 TGTGGGCCCCCAGGAGTCCTGCTCACCCGGCCAGTCATCCTTGCAATGGACCACTGTGGA 174 0 

1741 GAGCCCAGC CCT GACAGCT GGAGC CTGC GC CTCAAAAAGC AGTCGT GCGAGGGCAGCT GG 1800 

I II I I I I I I I I I I I I II I I II I I II I I I I I I I I I I II I I I I II . I I M I I I I I I I Ml 

1741 GAGC CCAGC CCT GACAGCT GGAGT CTGC GC CTCAAAAAGC AGT C CT GCGAGGGCAGT T GG 1800 

1801 GAGGATGT GCT GCACCTGGGCGAGGAGGCGC CCT C CCACCT CT ACT ACT GCC AGCT GGAG 1860 

. I II I I I II M I I I I I I I II I I M II I II I II II II II II II I II II I I I II M M 
1801 GAGGAT GT GCTGCAC CTT GGT GAGGAGT CACCTT C C CAC CT CTACT ACT GCC AGCT GGAG 1860 

1861 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1920 

II I I I I II I I II I II I II II II I M I II I II I II II I I II II II II I I I II II II . 
1861 GCCGGGGCCTGCTATGTCTTCACGGAGCAGCTGGGCCGCTTTGCCCTGGTAGGAGAGGCC 1920 

1921 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 1980 

II I I I I M I II I II I I II I I II I II I I III I I I II I I I I I I II I II I I I II II 
1921 CTCAGCGTGGCTGCCACCAAGCGCCTCAGGCTCCTTCTGTTTGCTCCCGTGGCCTGTACG 1980 

1981 T CCCTCGAGTACAACAT CC GGGT CTACT GCCT GC AT GACACCCAC GATGC ACT CAAGGAG 2040 

I I I II I II I I II II II II I II I II I II M M I II II I I I I II II I I I I I II I I 
1981 T CC CTT GAGT ACAACAT C C GAGT GT ACT GCCT AC ACGACAC C CAC GACGCT CT CAAGGAG 2040 

2041 GTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCAC 2100 

I II I II I II II I I II II I M I II II I I I I I I I II I II I I I I II II II II I I I II I I 
2041 GT GGT GCAGCT GGAGAAGCAGCT AGGT GGACAGCT GAT C CAGGAGCCT CGCGT CCT GC AC 2100 

2101 TTCAAGGACAGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGG 2160 

Mill I I I I II II I I I I I I II I II II I I M II II I I I I I II I I I II I II I I I I I I 
2101 T T CAAAGACAGT T AC CACAAC CT ACGTCT CT CC AT C CAC GAC GT GCCCAGCT C CCT GT GG 2160 

2161 AAGAGTAAGCT C CT T GT CAGCT ACCAGGAGATCC C CTTTT AT CAC AT CT GGAAT GGC ACG 2220 

I I II I I I II I I II II II I I M I I I I I I I I I I I I Mill I M I II I I I M I I II I 
2161 AAGAGCAAGCTACTTGT CAGCTACC AGGAGATCC CTTTTT AC CACAT CT GGAACGGC ACC 2220 

2221 CAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTG 2280 

1111 I II I LI I II I I U LI I II I I II II II II I II I II I II I L II ill III 
2221 CAGCAGT AT CT GC ACTGCAC CTT CACC CT GGAGC GCAT CAAC GCCAGCAC C AGC GACCTG 2280 

2281 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2340 



Db 



I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

2281 GCCTGCAAGGTGTGGGTGTGGCAGGTGGAGGGAGATGGGCAGAGCTTCAACATCAACTTC 2340 



Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 



2341 AACAT CACCAAGGACACAAGGTTT GCT GAGCTGCTGGCT CTGGAGAGT GAAGC GGGGGT C 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I II II I I I I I I I 
2341 AACAT CACTAAGGACACAAGGTTTGCT GAATTGTTGGCT CTGGAGAGTGAAGGGGGGGTC 24 00 

2401 CCAGCCCT GGT GGGC C C CAGT GCCTT CAAGATC C CCTTC CT CATT C GGCAGAAGATAATT 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II 
2401 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAAAAGATCATC 24 60 



2461 



2520 



TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 
I I II I I I I I I I I I I I I I I II I I I I I II I I I I I I I 111111 I I I II I I I I I I 
24 61 GC CAGT CT GGAC CCAC CCT GCAGC C GGGG CGC C GACT GGAGAACT CT AGCC C AGAAACTT 2520 

2521 CACCT GGACAGC CAT CT CAGCTTCTTT GCCT CCAAGC CCAGC CCCACAGCC AT GAT CCT C 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2521 CACCTGGACAGCCATCTTAGCTTCTTTGCCTCCAAGCCCAGCCCTACAGCCATGATCCTC 2580 

2581 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 264 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
2581 AACCTATGGGAGGCACGGCACTTCCCCAACGGCAACCTCGGCCAGCTGGCAGCAGCTGTG 2640 

2641 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2697 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
2641 GCCGGACTGGGCCAACCAGATGCTGGCCTCTTCACGGTGTCGGAGGCCGAGTGTTGA 2697 
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GI:34784158 



(house mouse) 



BC058084 3844 bp mRNA linear ROD 21-OCT-2003 

Mus musculus unc-5 homolog A (C. elegans), mRNA (cDNA clone 
MGC: 66671 IMAGE : 6813463 ) , complete cds . 
BC058084 
BC058084.1 
MGC. 

Mus musculus 
Mus musculus 
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Clone distribution: MGC clone distribution information can be found 
through the I.M.A.G.E. Consortium/ LLNL at: http://image.llnl.gov 
Series: IRAK Plate: 126 Row: b Column: 11 

This clone was selected for full length sequencing because it 
passed the following selection criteria: matched mRNA gi : 2334 6570. 
FEATURES Location/Qualifiers 
source 1. .3844 

/orgariism="Mus, mus cuius" 
/mol_type="mRNA" 
/strain="C57BL/6" 
/db_xref="taxon: 10090" 
/clone="MGC: 66671 IMAGE : 6813463" 

/tissue_type="Brain, mouse, 13.5, 14.5, 16.5, 17.5 dpc" 

/ c 1 one_l i b = " N I H_BMAP_FW 0 " 

/lab_host="DH10B" 

/note="Vector: pYX-ASC" 
gene 1. .3844 

/gene="Unc5a" 

/db_xref="LocusID: 107448" 

/db_xref="MGI: 894682" 
CDS 252. .2780 

/gene="Unc5a" 

/codon_start=l 

/product="Unc5a protein" 

/protein_id="AAH58084. 1" 



misc feature 



misc feature 



misc feature 



misc feature 



/db_xref="GI : 34784159" 
/db_xref="LocusID: 107448" 
/db_xref="MGI: 894682" 

/translation="MAVRPGLWPALLGIVLTAWLRGSGAQQSATVANPVPGANPDLLP 

HFLVEPEDVYI VKNKPVLLVCKAVPATQI FFKCNGEWVRQVDHVI ERSTDGS SGLPTM 

EVRIWSRQQVEKVFGLEEYWCQCVAWSSSGTTKSQKAYIRIAYLRKNFEQEPLAKEV 

SLEQGIVXPCRPPEGIPPAEVEWLRNEDLVDPSLDPNVYITREHSLVVRQARLADTPN 

YTCVAKNIVARRRSASAAVIVYVDGSWSPWSKWSACGLDCTHWRSRECSDPAPRNGGE 

ECRGADLDTRNCTSDLCLHTSSGPEDVALYIGLVAVAVCLILLLLVLVLIYCRKKEGL 

DSDVADSSILTSGFQPVSIKPSKADNPHLLTIQPDLSTTTTTYQGSLCPRQDGPSPKF 

QLSNGHLLSPLGSGRHTLHHSSPTSEAEDFVSRLSTQNYFRSLPRGTSNMAYGTFNFL 

GGRLMI PNTGI SLLI PPDAI PRGKI YEI YLTLHKPEDVRLPLAGCQTLLSPI VSCGPP 

GVLLTRPVILAMDHCGEPSPDSWSLRLKKQSCEGSWEDVLHLGEESPSHLYYCQLEAG 

ACYVFTEQLGRFALVGEALSVAATKRLRLLLFAPVACTSLEYNIRVYCLHDTHDALKE 

WQLEKQLGGQLIQEPRVLHFKDSYHNLRLSIHDVPSSLWKSKLLVSYQEIPFYHIWN 

GTQQYLHCTFTLERWASTSDLACKVWWQVEGDGQSFNINFNITKDTRFAEMLALES 

EGGVPALVGPSAFKIPFLIRQKIITSLDPPCSRGADWRTLAQKLHLDSHLSFFASKPS 

PTAMI LNLWEARHFPNGNLGQLAAAVAGLGQPDAGLFTVSEAEC " 

714. .926 

/gene="Unc5a" 

/note="IG; Region: Immunoglobulin" 

/db_xref="CDD:smart00409" 

984. .1130 

/gene="Unc5a" 

/note="TSPl; Region: Thrombospondin type 1 repeats" 

/db_xref="CDD:smart00209" 

1566. .1877 

/gene="Unc5a" 

/note="ZU5; Region: Domain present in ZO-1 and Unc5-like 

netrin receptors" 

/db_xref="CDD:smart00218" 

2496. .2684 

/gene="Unc5a" 

/note="DEATH; Region: DEATH domain, found in proteins 
involved in cell death (apoptosis) . Alpha-helical domain 
present in a variety of proteins with apoptotic functions. 
Some (but not all) of these domains form homotypic and 
heterotypic dimers" 
/db xref="CDD:smart00005" 



ORIGIN 



Query Match 72 . 6%; 

Best Local Similarity 84.6%; 
Matches 2283; Conservative 



Score 1957.4; 
Pred. No. 0; 
0; Mismatches 



DB 10; Length 3844; 
246; Indels 168; Gaps 



l; 



Qy 



Db 



1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
252 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCACTGCCTGGCTT 311 



Qy 

Db 



61 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 120 

II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

312 CGTGGTTCGGGTGCCCAGCAGAGTGCCACAGTGGCCAACCCAGTGCCTGGTGCCAACCCG 371 



Qy 

Db 



121 
372 



GACCT GCTT CC C CACTT C CT GGT GGAG CC C GAGGAT GT GT ACAT C GT CAAGAACAAGCC A 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 11 I I I I I I I I I I I I I I I I I I I I I I 
GACCT GCT GCC CCACTT C CT GGTAGAGC CGGAGGACGTGT AC ATT GT CAAGAACAAGCC C 



180 
431 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 



181 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

432 GTGCTGCTGGTGTGCAAGGCTGTGCCCGCCACCCAGATCTTCTTCAAGTGCAACGGGGAA 491 

241 T GGGT GCGC CAGGT GGAC C AC GT GAT C GAGC GCAGCACAGAC GGGAGCAGT GGGCT GCCC 300 

I I I I I I I I I I I I I II I I I I I II II I I I I I I I I I I I I I I II I I II I I I I 

492 TGGGTTCGCCAGGTCGATCACGTCATTGAACGCAGCACTGACGGCAGCAGCGGATTGCCA 551 

301 ACCATGGAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAG 360 

I I I I I I I I I I I I I I II II II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

552 ACCAT GGAGGT CCGGAT CAACGT AT CAAGGC AGC AGGT C GAGAAAGT GTT T GG GCT GGAG 611 

361 GAAT ACTGGT GC CAGT GCGTGGC AT GGAGCT CCT C GGGC ACCAC CAAGAGT CAGAAGG CC 420 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I 

612 GAGT ACTGGT GC CAGT GT GTGGCAT GGAGCT C CT C AGGAACCACCAAAAGCCAGAAGGCC 671 

421 TACATCCGCATAGCCAGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTG 480 

I I II I I I I II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

672 TACATCCGGATTGCCTATTTGCGCAAGAACTTTGAGCAGGAGCCGCTGGCCAAGGAAGTG 731 

481 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 540 

II I I I I I I I I II I I I I I I I I II II II II I I I I I II Mill I I I I I Ml 

732 TCACTGGAGCAAGGCATTGTGCTACCTTGTCGCCCCCCGGAAGGAATCCCCCCAGCTGAG 791 

541 GTGGAGTGGCT C C GGAAC GAGGACCT G GT GGACC CGT C C CTGGACC CCAAT GT AT ACAT C 600 

I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

792 GTGGAGTGGCT CC GAAAT GAGGAC CT C GT GGACC CCT C C CT C GAC CC CAAT GT GT ACAT C 851 

601 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 660 

II I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

852 ACACGGGAGCACAGCCT AGT C GT GC GGCAGGC CC GCCT GGCC GACACT CCCAACT AC AC C 911 

661 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 720 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II II I I I I I II II 

912 TGCGTGGCCAAGAACATCGTGGCCCGTCGCCGAAGCGCCTCTGCGGCCGTCATTGTTTAT 971 

721 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 780 
Ml 

972 GTG 974 

781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 840 

975 974 

841 TGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGC 900 

II II III 

975 GATGGGAGC 983 



901 



984 



961 



TGGAGCCCGTGGAGCAAGTGGTCGGCCTGT GGGCT GGACTGCACCCACTGGCGGAGCCGT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TGGAGCCCATGGAGTAAGTGGTCAGCCTGCGGGCTTGACTGCACCCACTGGCGGAGCCGG 1043 



GAGT GCT CT GACCCAGCACCCC GCAAC GG AGGGGAGGAGT GC CAGGGCACT GACCT GGAC 1020 

I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I III I I I I I I I I I I I 

1044 GAGTGCTCCGACCCAGCGCCCCGCAACGGAGGTGAGGAGTGCCGGGGTGCTGACCTGGAC 1103 

1021 ACCCGCAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCC 1080 



Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 II 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

1104 ACCCGCAACTGTACCAGTGACCTCTGCCTGCACACCTCTTCCGGCCCCGAGGACGTGGCT 1163 

1081 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II 
1164 CTCTACATCGGCCTCGTCGCCGTGGCCGTGTGCCTCATCTTGCTGCTGCTGGTCCTCGTC 1223 

1141 CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 1200 

III I II I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
1224 CTCATCTACTGCCGCAAGAAGGAAGGACT GGACT CAGACGT GGCTGACTCATCCAT CCTT 1283 

1201 ACCT CAGGCTT C C AGCC C GT C AGCAT CAAGC CCAGCAAAGC AGACAACC C C CAT CT GCT C 1260 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1284 ACCTCAGGCTTCCAGCCTGTCAGCATCAAGCCCAGCAAAGCAGACAATCCCCATCTGCTC 1343 

1261 ACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGG 1320 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
1344 AC CAT C C AAC C GGAC CT C AGC AC C AC C AC GAC C AC CT AC C AG GG C AGC CTGTGTCCCCGG 1403 

1321 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1380 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1404 CAGGATGGACCCAGCCCCAAGTTCCAGCTCTCTAATGGTCACCTGCTCAGCCCACTGGGC 1463 

1381 GGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCC 144 0 

I MINIM II II I I I I I II I II II II II II I I I II I II II II I I I I I I II I I 

1464 AGTGGCCGCCATACGCTGCACCACAGCTCCCCCACCTCTGAGGCTGAGGACTTCGTCTCC 1523 

1441 CGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTAT 1500 

II I I I II II II II I I II I II II II II I I I II I II II II I I II I II II I I I I I I 
1524 CGCCTCTCCACCCAAAACTACTTTCGTTCTCTGCCCCGCGGTACCAGCAACATGGCCTAT 1583 

1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1560 

I II II I I II I II II I I II I II I I II I II M II II I I I II I I I I II I II I II II I I I II 
1584 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAACACAGGAATCAGCCTCCTC 



1561 



1643 



AT C CCC CCAGAT GC CAT ACC CC GAGGGAAGAT CT AT GAGAT CTACCT CACGCTGCACAAG 1620 
II II II I II II II I I II I III I II II I I I I II I II II II I I I I I II II I I II I 
1644 AT ACCCCC GGAC GC CAT CC C CC GAGGAAAGATCT ACGAGAT CT AC CT CACT CT GCACAAG 1703 

1621 C CGGAAGACGT GAGGTT GC C C CT AGCTGGCT GT CAGACCCT GCT GAGT C C C AT CGTT AGC 1680 

II I I II I I II II I I I I I II I I I I I I I I I II II I II I I I II M I I I I I II I I II I I II I 
1704 CCAGAAGAC GT GAGGTT GCCCCTAGCT GGCT GTCAGACC CT GCT GAGT C CT AT CGT T AGC 1763 

1681 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1740 

Mill Mill II I I I II II II I I I I II II II I I I I II I II II I I I I I I II I III 
1764 TGTGGGCCCCCAGGAGTCCTGCTCACCCGGCCAGTCATCCTTGCCATGGACCACTGCGGG 1823 

1741 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1800 

I I I I II I I II II I I I II I I I I I I I I I II I I I I II I II II I I I II II I II I I I I II I 
1824 GAGC CCAGT CCCGACAGCTGGAGC CT GC GCCTCAAAAAGCAGT CCT GTGAGGGC AGCT GG 1883 

1801 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1860 

Mill II II I I II II I II II II II II II II I II I II II I II II I II I I II I II I 
1884 GAGGAC GT GCT GCAC CT T GGTGAGGAGT CGC CCT CT CAT CT CT ACT ACT GCC AGCT GGAG 1943 

1861 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1920 

III I I I M I I II II I II II II I I II I II I I I I II II I II I II II II II II I I I I I 



Db 1944 GCCGGGGCCTGCTATGTCTTTACCGAGCAGCTAGGCCGCTTTGCCCTGGTGGGAGAGGCC 2003 

Qy 1921 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 1980 

I I I I I I I I I I I I I I I I I I I 1 I I I I I I I III I I I I I I I I I I I II I I I II I I I II 
Db 2004 CTCAGCGTGGCTGCCACCAAGCGCCTCAGGCTCCTTCTGTTTGCCCCTGTGGCCTGTACG 2063 

Qy 1981 TCCCTCGAGTACAACATCCGGGT CTACT GCCTGCAT GACACCCACGAT GCACT CAAGGAG 204 0 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2064 TCCCT CGAGTACAACATCCGAGT GTACT GCCTGCACGACACCCACGATGCTCT CAAGGAG 2123 

Qy 2041 GT GGT GCAGCT GGAGAAGCAGCT GGGGGGAC AGCT GAT CC AGGAGC C AC GGGT C CT GCAC 2100 

I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I II 
Db 2124 GTGGT GCAGCT GGAGAAGCAGCT GGGT GGAC AGCT GAT C C AGGAGC C CCGT GT C CT GCAC 2183 

Qy 2101 TT CAAGGACAGT T AC CACAAC CT GC GC CT AT CC AT C C AC GATGT GC C CAGCT C C CT GT GG 2160 

I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 2184 TT CAAAGAC AGT T AC CACAACCT AC GT CT GT CCAT C C AC GACGT GC C CAGCT C C CT GT GG 2243 

Qy 2161 AAGAGTAAGCT C CT T GT CAGCT AC CAGGAGATC C C CT TTTATCACAT CT GGAAT GGCAC G 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 2244 AAGAGCAAGCT C CT T GT CAGCT AC CAGGAGATC CCT T TTT ACCAC AT CT GGAAT GGCACT 2303 

Qy 2221 CAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTG 2280 

I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 2304 CAGCAGT AT CT GCACTGC ACCTT CACCCTGGAGC GCGT CAATGC C AGCAC CAGCGAC CT G 2363 

Qy 2281 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2340 

I I I I I I I II I I I I I I I I I I I I I I I I I I I II I II I I I I I I I II II I I II I I I I I I 
Db 2364 GCCT GCAAGGTGT GGGTGTGGCAGGTGGAGGGAGAT GGACAGAGCTT CAACATCAACTTT 2423 

Qy 2341 AACATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTC 2400 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 2424 AAC AT CACTAAGGAC AC GAGGTTT GCT GAAATGCT GGCTCT GGAGAGT GAAGGGGGGGT C 2483 

Qy 2401 C CAGC CCT GGT GGGC CC CAGTGCCTT CAAGATC CC CT T CCT CAT T C GGCAGAAGATAATT 24 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Mill III 

Db 2484 C CAGC CCT GGT GGGCCC CAGT GC CTT CAAGATC CC CTT CCT CAT T C GGCAAAAGAT CAT T 2543 

Qy 2461 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2520 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2544 ACCAGCCTGGACCCACCCTGCAGCCGGGGCGCCGACTGGCGAACTCTAGCCCAGAAACTT 2603 

Qy 2521 CAC CT GGAC AGC CAT CT CAGCTT CTT T GCCT CCAAGC C CAGCC C CACAGC C AT GAT C CT C 2580 

II I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 2604 CACCT GGACAGC CAT CTTAGCT T CTTT GC CT C CAAGCCCAGCC CT ACAGC CAT GAT C CT C 2663 

Qy 2581 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I III 

Db 2664 AACCTATGGGAGGCGCGGCACTTCCCCAACGGCAACCTCGGCCAGCTGGCCGCAGCTGTG 2723 

Qy 2641 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2697 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 2724 GCCGGACTGGGCCAGCCAGATGCTGGCCTCTTCACCGTGTCAGAGGCCGAGTGCTGA 2780 
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BC009333 2688 bp mRNA linear PRI 25-MAR-2004 

Homo sapiens unc-5 homolog A (C. elegans), mRNA (cDNA clone 
IMAGE: 4126760) , partial cds . 
BC009333 

BC009333.2 GI: 40226527 

Homo sapiens (human) 
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Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
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FEATURES Location/Qualifiers 
source 1. .2688 

/organism="Homo sapiens" 

/mol_type= M mRNA" 

/db_xref="t axon: 9606" 

/ clone= " IMAGE :4126760" 

/tissue_type="Brain, neuroblastoma" 

/clone_lib="NIH_MGC_19" 

/lab_host="DH10B-R" 

/note="Vector: pOTB7" 
gene <1. .2688 

/gene="UNC5A" 

/note="synonym: UNC5H1" 

/db_xref="LocusID: 90249" 

/db_xref="MIM: 607869" 
CDS <1. .1627 

/gene="UNC5A" 

/ codon_start=2 

/product="UNC5A protein" 

/protein_id="AAH09333.2" 

/db_xref="GI : 40226528" 

/db_xref="LocusID: 90249" 

/db_xref="MIM: 607869" 

/translation="DVALWGLIAVAVCLVLLLLVLILVYCRKKEGLDSDVADSSILT 
SGFQPVSIKPSKADNPHLLTIQPDLSTTTTTYQGSLCPRQDGPSPKFQLTNGHLLSPL 
GGGRHTLHHSSPTSEAEEFVSRLSTQNYFRSLPRGTSNMTYGTFNFLGGRLMIPNTGI 
SLLIPPDAIPRGKIYEIYLTLHKPEDVRLPLAGCQTLLSPIVSCGPPGVLLTRPVILA 
MDHCGEPSPDSWSLRLKKQSCEGSWEDVLHLGEEAPSHLYYCQLEASACYVFTEQLGR 
FALVGE7VLSVAAAKRLKLLLFAJPVACTSLEYNIRVYCLHDTHDALKEWQLEKQLGGQ 
LIQEPRVLHFKDSYHNLRLSIHDVPSSLWKSKLLVSYQEIPFYHIWNGTQRYLHCTFT 
LERVSPSTSDLACKLWWQVEGDGQSFSINFNITKDTRFAELLALESEAGVPALVGPS 
AFKIPFLIRQKIISSLDPPCRRGADWRTLAQKLHLDSHLSFFASKPSPTAMILNLWEA 
RHFPNGNLSQLAAAVAGLGQPDAGLFTVSEAEC" 
misc_feature 413. .724 

/gene="UNC5A" 

/note="ZU5; Region: Domain present in ZO-1 and Unc5-like 
netrin receptors" 
/db_xref="CDD:smart00218" 
misc_feature 1343. .1594 

/gene="UNC5A" 

/ note="DE!ATH; Region: DEATH domain, found in proteins 
involved in cell death (apoptosis) . Alpha-helical domain 
present in a variety of proteins with apoptotic functions. 
Some (but not all) of these domains form homotypic and 
heterotypic dimers" 
/db_xref="CDD:smart00005" 

ORIGIN 



Query Match 

Best Local Similarity 



60.3%; 
99.9%; 



Score 1625.4; DB 9; Length 2688; 
Pred. No. 4.1e-269; 



Matches 1626; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 



Qy 1071 GGACGTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCT 1130 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 

Db 1 GGACGTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCT 60 

Qy 1131 TGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTC 1190 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I J II I I I I I I I I I I I I 
Db 61 TGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTC 120 

Qy 1191 GT C C ATT CT CACCT CAGGCTT C CAGC CC GT C AGC AT CAAGC CC AGCAAAGCAGACAAC C C 1250 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 121 GT C C ATT CT CACCT C AGGCTTC CAGC CC GT CAGC AT CAAGC C CAGCAAAGCAGACAAC C C 180 

Qy 1251 CCAT CT GCT CACCATCCAGCCGGACCTC AGC ACC AC C AC CACC ACCT AC CAGGGCAGT CT 1310 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 CCAT CT GCT CACCAT CCAGCCGGAC CT CAGC AC C AC C AC CAC CAC CTAC CAGGGCAGT CT 24 0 

Qy 1311 CTGTCCCCGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAG 1370 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 CT GT CC CCGGCAGGAT GGGCCCAGC C CCAAGTT CCAGCT CACCAAT GGGCACCT GCT CAG 300 

Qy 1371 C C CCCT GGGT GGCGGC C GC CACACACT GCAC CACAGCT CT C C CAC CT CT GAGGC C GAGGA 1430 

I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 C CCCCT GGGT GGCGGCC GCCACACACT GCAC CACAGCT CT C C CAC CT CT GAGGCC GAGGA 360 

Qy 1431 GTTCGTCTCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAA 1490 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 361 GTTCGTCTCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAA 420 

Qy 1491 CAT GACCT AT GGGACCTT CAACTT CCT C GGGGGC C GGCT GAT GAT CC CTAAT ACAGGT AT 1550 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 421 CAT GAC CT AT GGGACCTT CAACT T CCT C GGGGGC CGGCT GAT GAT CC CTAAT ACAGGAAT 4 80 

Qy 1551 CAGC CT CCT CAT CC CCCCAGAT GC CAT AC C CCGAGGGAAGAT CT AT GAGAT CT AC CT CAC 1610 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 CAGCCT C CT CAT CCCCCCAGAT GCCAT AC C C CGAGGGAAGAT CTAT GAGAT CT ACCT CAC 540 

Qy 1611 GCTGCACAAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCC 1670 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 541 GCT GCACAAGCCGGAAGAC GTGAGGTT GC C C CT AGCT GGCT GT CAGACC CT GCT GAGT CC 600 

Qy 1671 CATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGA 1730 

I I I I I I I I I I I I I I I I I I I I II I I I II I II I I I I I II I I II I II I I I I I I I I I I I I I I I I 
Db 601 CATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGA 660 

Qy 1731 CCACTGT GGGGAGC CCAGC C CT GACAGCT GGAGC CT GC G C CT CAAAAAGCAGT CGT GC GA 1790 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 CCACTGT GGGGAGCC CAGC C CT GACAGCT GGAGC CT GC GC CT CAAAAAGCAGT C GT GC GA 720 

Qy 1791 GGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTG 1850 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 721 GGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTG 780 

Qy 1851 CCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGT 1910 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 CCAGCT GGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGT 840 



Qy 1911 GGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGT 1970 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 841 GGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGT 900 

Qy 1971 GGCCTGCACCTCCCTCGAGTACAACATCCGGGTCTACTGCCTGCATGACACCCACGATGC 2030 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 GGCCTGCACCTCCCTCGAGTACAACATCCGGGTCTACTGCCTGCATGACACCCACGATGC 960 

Qy 2031 ACT CAAGGAGGTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCT GATCCAGGAGCCACG 2090 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 ACT CAAGGAGGTGGT GCAGCT GGAGAAGCAGCTGGGGGGAC AGCT GAT C CAGGAGC CACG 1020 

Qy 2091 GGT CCT GCACTTCAAGGACAGTT ACCACAACCTGCGC CT AT CCAT CCACGAT GTGC CC AG 2150 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 1021 GGT CCT GCACTTCAAG GACAGTT AC CACAAC CTGCGC CT AT CCAT C CAC GAT GTGC C C AG 1080 

Qy 2151 CT C CCT GTGGAAGAGT AAGCT CCTT GT CAGCT AC CAGGAGAT CC CCTTTT AT CACAT CT G 2210 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1081 CTC CCT GT GGAAGAGT AAGCT CCTT GT CAGCT AC CAGGAGAT CC CCTTTT AT CACAT CT G 114 0 

Qy 2211 GAAT GGCAC GC AGC GGT ACTT GCACTGCACCT TCACC CT GGAGC GT GT C AGCCCCAGCAC 2270 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1141 GAAT GGCAC GCAGC GGT ACTT GCACTGCACCT TCACC CT GGAGC GT GT C AGC CCCAGC AC 1200 

Qy 2271 TAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAG 2330 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1201 TAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAG 1260 

Qy 2331 CATCAACTTCAACATCACCAAGGACACAAGGTTTGCT GAGCTGCTGGCTCT GGAGAGTGA 2390 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 CAT CAACTT CAACAT CAC CAAGGACACAAGGTTT GCT GAGCT GCT GGCT CT GGAGAGT GA 1320 

Qy 2391 AGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCA 2450 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1321 AGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCA 1380 

Qy 2451 GAAGATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGC 2510 

I I I I I I I I I I I I LI I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 GAAGATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGC 1440 

Qy 2511 CCAGAAACT CCAC CTGGACAGCCAT CT CAGCTTCTTT GCCT CCAAGCCCAGC CCCACAGC 2570 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 CCAGAAACT CCAC CT GGACAGCCAT CT CAGCTTCTT T GCCT CCAAGCCCAGCC CCACAGC 1500 

Qy 2571 CATGATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGC 2630 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 CATGATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGC 1560 

Qy 2631 TGCAGCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGA 2690 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 1561 TGCAGCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGA 1620 

Qy 2691 GTGCTGA 2697 

I I I I I I I 

Db 1621 GTGCTGA 1627 



RESULT 12 

BD057525 

LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 

REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



linear PAT 27-AUG-2002 



FEATURES 

source 



ORIGIN 



Masu,M. and Masu,K.K. 



BD057525 1787 bp DNA 

Netrin receptors. 
BD057525 

BD057525.1 GI: 22603131 
JP 2001505062-A/2. 
synthetic construct 
synthetic construct 

other sequences; artificial sequences. 
1 (bases 1 to 1787) 

Lavigne,M.T. , Leonardo, D . E . , Hinck,L. , 
Netrin receptors 

Patent: JP 2001505062-A 2 17-APR-2001; 

THE REGENTS OF THE UNIV OF CALIFORNIA 

PN JP 2001505062-A/2 

PD 17-APR-2001 

PF 19-FEB-1998 JP 1998536840 

PR 19-FEB-1997 US 08/808982 

PI MARC TESSIER LAVIGNE, DAVID E LEONARDO, LINDSAY HINCK, MASAYUKI 
PI MASU, 

PI KAZUKO KEINO MASU 

PC C07K1/00, C07K14/00, C07K17/00, C07H21/02 , C07H21/04 , G01N33/53 CC 

Strandedness : Double; 
CC Topology: Linear; 

FH Key Location/Qualifiers. 
Location/ Qualifiers 
1. .1787 

/ organism=" synthetic construct" 
/mol_type=" genomic DNA" 
/db xref="taxon: 32630" 



Query Match 57.6%; 
Best Local Similarity 98.5%; 
Matches 1651; Conservative 



Score 1552.4; DB 6; 
Pred. No. 1.5e-256; 
0; Mismatches 16; 



Length 1787; 



Indels 



Qy 



Db 



9; Gaps 



8; 



1025 GCAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCT 1084 

1 1 1 1 1 1 1 1 in i in i in 1 1 1 nil ii r 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 in 1 1 1 1 1 1 1 

1 GCAACTGTACCAGTGACCTCTG-GTACACACTGCTTCTGGCCCTGAGGACGTGGCCCTCT 59 



Qy 

Db 

Qy 

Db 



1085 ATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCG 1144 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
60 ATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCG 119 

1145 TTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCT 1204 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
120 TTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCT 179 



Qy 

Db 

Qy 

Db 



1205 CAGGCT T C CAGCC CGT C AGCAT C - AAGCC C AGCAAAGCAGACAAC CCCCAT CT GCT CACC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
180 CAGGCT T CCAGCC CGT C AGCAT CTAAGCCCAGCAAAGCAGACAAC C CC CAT CTGCT C ACC 

1264 AT C CAG C C GGACCTCAGCACCAC CAC CACC ACCT AC CAGGGC AGT CT CT GT C C CC GGC AG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
240 AT C CAGC C GGACCT C AGCACC AC CAC CACC ACCT AC CAGGGCAGT CT CT GT C C CC GGC AG 



1263 



239 



1323 



299 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1324 GATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGC 1383 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I 11 M I I I I I I I I I I I I I I I I I I I I I 

300 GATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGC 359 

1384 GGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGC 1443 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

360 GGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGC 419 

1444 CTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGG 1503 

I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
CTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGG 



420 



479 



1563 



1504 ACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATC 
I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
480 ACCTT CAACTT CCT C GGGGGC C GGCT GAT GAT C C CT AAT ACAGGAAT CAGCCT C CT CAT C 539 

1564 CCCCCAGAT GCCAT ACCC CGAGGGAAGAT CT AT GAGAT CT AC CTCACGCT GC AC AAGC C G 1623 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

540 CC CCC AGAT GCCAT ACCCCGAGGGAAGAT CT AT GAGAT CT AC CTCACGCTGCACAAGC CG 599 

1624 GAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGT 1683 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
- 600 GAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGT 



659 



1684 GGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAG 1743 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

GGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAG 



660 



719 



1744 CCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAG 1803 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCCAGCCCTGACAGCTGGAGCCTGGCCCTCAAAAAGCAGTCGTGCGAGGG-AGCTGGGAG 



720 



778 



1804 GATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCC 1863 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

779 GAT GT - CT GCAC CT GGGCGAGGAGGC GCCCT C C C AC CT CT ACT ACT GC CAGCT GGAGGC C 837 

1864 AGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTC 1923 

I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

838 AGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTC 897 

1924 AGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCC 1983 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

898 AGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCC 957 

1984 CT C GAGTACAAC AT C CGGGT CT ACT GCCT GCAT GAC ACCCACGAT GCACT CAAGGAGGT G 2043 
I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

958 CT CGAGTACAACAT CCGGGTCTACTGCCTGCATGACACCCACGAT GCACTCAAGGAGGTG 1017 

2044 GT GCAGCT GGAGAAGC AGCT GGGGGGACAGCT GATC C AGGAGCCAC GGGT CCT GC ACTT C 2103 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1018 GT GCAGCT GGAGAAGCAGCT GGGGGGACAGCT GAT CCAGGAGCCACGGGT CCT GC ACTT- 107 6 

2104 AAGGACAGT T ACCACAAC CT GCGCCT AT C CAT C CAC GAT GTGC CCAGCTC CCT GT G GAAG 2163 

I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1077 AAGGACAGTT AC CACAAC CT — GCCCT AT CAT CCACGAT GTGC CCAGCT CC CT GT GGAAG 1134 



Qy 

Db 



2164 
1135 



2223 



1194 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



2224 CGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1195 CGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCC 



2283 



1254 



2343 



2284 TGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAAC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1255 TGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAAC 1314 

2344 ATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCA 2403 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I.I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1315 ATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCA 1374 

2404 GCCCTGGTGGGCCCCAGTGCCTTCAAGATGCCCTTCCTCATTCGGCAGAAGATAATTTCC 2463 
I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
GCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCC 1434 



1375 



2523 



2464 AGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCAC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1435 AGC CT GGAC CCACC CT GT AGGC GGGGT GC C GACT GGCGGACT CT GGC CC AGAAACT C CAC 1494 



2524 CT GGACAGC CAT CT CAGCTT CT T T GCCT C CAAGCCCAGC C CC ACAGC CAT GAT CCT CAAC 
I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1495 CT GGACAGC CAT CT CAGCTT CTTT GCCT C CAAGCC CAGC C CC ACAGC CAT GATCCT CAAC 



2583 



1554 



2643 



2584 CTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
1555 CTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCT 1614 

2644 GGACT GGGC CAGC C AGAC GCT GGCCT C - T T C ACAGT G- T C G GAGGCT GAGT GCT GA 2697 

II I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I 
1615 GGGACT GGC CAGCAGGAC GGTGGCTT CT T T C ACAGT GT T C GGAGGCT GAGT GCT GA 1670 



RESULT 13 

AX054976 

LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 

REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

FEATURES 

source 



linear PAT 13-JAN-2001 



AX054976 9700 bp DNA 

Sequence 91 from Patent WO0073328. 
AX054976 

AX054976. 1 GI : 12228344 



synthetic construct 
synthetic construct 

other sequences; artificial sequences. 
1 

van Criekinge, W. , Roelens,I., Bogaert,T. and Verwaerde, P . 
Unc-5 constructs and screening methods 
Patent: WO 0073328-A 91 07-DEC-2000; 
Devgen NV (BE) 

Location/Qualifiers 

1. .9700 

/organism=" synthetic construct" 
/mol_type="unassigned DNA" 
/db xref="taxon: 32630" 



ORIGIN 



/note="plasmid pGC1037 ,? 



Query Match 48.3%; 
Best Local Similarity 99.8%; 
Matches 1304; Conservative 



Score 1302.8; DB 6; 
Pred. No. 8.4e-214; 
0; Mismatches 2; 



Length 9700; 
Indels 0; Gaps 



0; 



Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 



1392 



1452 



67 



1512 



127 



1572 



187 



1632 



247 



1692 



307 



1752 



367 



CACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCAC 1451 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCAC 66 

CCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAA 1511 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii 1 1 1 

CCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAA 126 

CTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGA 1571 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I II II I I I I 

CT T C CTC GGGGGC CGGCT GAT GAT CCCTAAT AC AGGAAT CAGCCTCCT CAT CCC CC C AGA 186 

T GCCATACCC CGAGGGAAGAT CT AT GAGAT CT AC CT C AC GCT GCACAAGC CGGAAGACGT 1631 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
T GC CATACCCCGAGGGAAGATCT AT GAGAT CTACCT CAC GCT GCACAAGC CGGAAGACGT 246 

GAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCC 1691 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCC 306 

TGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCC 1751 
I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCC 366 

T GACAGCT GGAGCCT GC GCCT CAAAAAGCAGT C GT GC GAGGGCAGCT GGGAGGATGTGCT 1811 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
T GACAGCT GGAGCCT GC GCCT CAAAAAGCAGT C GT G C GAGGGCAGCT GGGAGGATGT GCT 426 



1812 GCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTG 1871 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTG 



427 



486 



1872 CTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGC 1931 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I 
487 CTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGC 546 

1932 TGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTA 1991 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
547 TGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTA 606 

1992 CAAC ATC C GGGT CT ACT GCCT GCAT GACAC C CAC GAT GC ACT CAAGGAGGT GGT GC AGCT 2051 
I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I 
607 CAAC AT C CGGGT CT ACT GCCT GCAT GACACCCACGAT GC ACTCAAGGAGGT GGT GCAGCT 666 

2052 GGAGAAGCAGCT GGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTT CAAGGACAG 2111 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
667 GGAGAAGCAGCTGGGGGGACAGCTGAT CCAGGAGCCACGGGTCCTGCACTT CAAGGACAG 726 

2112 TT AC CACAACCT GC GC CT AT C CAT CCACGAT GT GC C C AGCT CCCTGT GGAAGAGTAAGCT 2171 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 



727 



TT ACCACAACCT GC GC CT AT C CAT C CAC GAT GT GCCC AGCTCCCT GTGGAAGAGTAAGCT 786 



Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 



2172 CCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCGGTACTT 2231 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
787 CCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCGGTACTT 846 

2232 GCACT GCAC CTT CACC CT GGAGCGT GT CAGC C C CAGC ACT AGT GAC CT GGCCT GCAAGCT 2291 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

847 GCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCT 906 

2292 GT GGGT GT GGCAGGT GGAGGGCGACGGG CAGAGCTT C AGCAT C AACTT CAAC AT CACCAA 2351 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
907 GTGGGT GT GGCAGGT GGAGGGCGACGGGCAGAGCTT CAGCATCAACTT CAAC AT CACCAA 966 

2352 GGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGT 2411 

I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
967 GGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCAAGCCCTGGT 102 6 

2412 GGGCCCCAGTGCCTT CAAGAT CCCCTTCCT CATT CGGCAGAAGATAATTT C CAGCCT GGA 2471 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1027 GGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTGGA 108 6 

2472 CCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAG 2531 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1087 CCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAG 1146 



2532 



2591 



C CATCT CAGCTT CTTT GCCT C CAAGC CCAGC C C CACAGC CAT GAT CCT CAAC CT GT GGGA 
I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1147 C CATCT CAGCTT CTTTGCCT CCAAGC CCAGC C C CACAGC CAT GAT CCT CAAC CT GT GGGA 1206 

2592 GGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGG 2 651 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1207 GGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGG 1266 

2652 CCAGC CAGACGCTGGCCT CTT CACAGT GTCGGAGGCT GAGT GCTGA 2697 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1267 CCAGCCAGACGCT GGCCT CTT CACAGT GT C GGAGGCT GAGT GCT GA 1312 



RESULT 14 

MMU72634 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 

TITLE 

JOURNAL 



MMU72634 9299 bp mRNA linear ROD 13-MAY-1997 

Mus musculus rostral cerebellar malformation protein (rem) mRNA, 
complete cds. 
U72634 

U72634.1 GI:2088526 

Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi; Muridae; Murinae; Mus. 
1 (bases 1 to 9299) 

Ackerman,S.L. , Kozak,L.P., Przyborski, S .A. , Rund, L . A. , Boyer,B.B. 
and Knowles,B.B. 

The mouse rostral cerebellar malformation gene encodes an 

UNC-5-like protein 

Nature 386 (6627), 838-842 (1997) 



MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

FEATURES 

source 



gene 
CDS 



97271898 
9126743 

2 (bases 1 to 9299) 

Ackerman, S . L. , Kozak,L.P., Rund, L . A. and Knowles,B.B. 
Direct Submission 

Submitted (25-SEP-1996) The Jackson Laboratory, 600 Main Street, 
Bar Harbor, ME 04609, USA 

. Location/Qualifiers 
1. .9299 

/organism= n Mus musculus" 

/mol_type="mRNA" 

/strain="C57B6/SJL" 

/db_xref="taxon: 10090" 

/ chromosome= " 3 " 

/map= "between Amyl and Mpmv9 ff 

1. .9299 

/gene="rcm" ■ 

151. .2946 

/gene="rcm" 

/function="transmembrane receptor" 
/note="similar to C. elegans UNC-5" 
/codon_start=l 

/product="rostral cerebellar malformation protein" 

/protein_id="AAB54103.1" 

/db_xref="GI: 2088527" 

/ 1 r ans 1 a t ion= "MRKGLRATAARCGLGLGYLLQMLVLPALALLSAS GTGSAAQDDE 
FFHELPETFPSDPPEPLPHFLIEPEEAYIVKNKPVNLYCKASPATQIYFKCNSEWVHQ 
KDHWD E RVDET S GL I VREVS I E I S RQQVE EL FG P E D YWCQ CVAW S S AGTT K S RKAYV 
RI AYLRKTFEQEPLGKEVS LEQEVLLQCRP PEGI PVAEVEWLKNEDI I DPAEDRNFYI 
TIDHNLIIKQARLSDTANYTCVAKNIVAKRKSTTATVIVYVNGGWSTWTEWSVCNSRC 
GRGYQKRTRTCTNPAPLNGGAFCEGQSVQKIACTTLCPVDGRWTSWSKWSTCGTECTH 
WRRRECTAPAPKNGGKDCDGLVLQSKNCTDGLCMQAAPDSDDVALYVGIVIAVTVCLA 
ITVWALFVYRKNHRDFESDIIDSSALNGGFQPVNIKAARQDLLAVPPDLTSAAAMYR 
GPVYALHDVSDKIPMTNSPILDPLPNLKIKVYNSSGAVTPQDDLAEFSSKLSPQMTQS 
LLENEALNLKNQSLARQTDPSCTAFGTFNSLGGHLI I PNSGVSLLI PAGAI PQGRVYE 
MYVTVHRKENMRPPMEDSQTLLTPWSCGPPGALLTRPVILTLHHCADPSTEDWKIQL 
KNQAVQGQWEDWWGEENFTTPCYIQLDAEACHILTENLSTYALVGQSTTKAAAKRL 
KLAI FGPLCCS SLEYSI RVYCLDDTQDALKEVLQLERQMGGQLLEEPKALHFKGS I HN 
LRLSIHDIAHSLWKSKLLAKYQEIPFYHIWSGSQRNLHCTFTLERLSLNTVELVCKLC 
VRQVEGEGQI FQLNCTVSEEPTGI DLPLLDPASTITTVTGPSAFS I PLPI RQKLCS SL 
DAPQTRGHDWRMLAHKLNLDRYLNYFATKSSPTGVILDLWEAQNFPDGNLSMLAAVLE 
EMGRHETWS LAAEGQY " 



ORIGIN 



Query Match 36. 8%; 

Best Local Similarity 62.7%; 
Matches 1660; Conservative 



Score 992; DB 10; Length 9299; 
Pred. No. 1.9e-160; 
0; Mismatches 925; Indels 63; 



Gaps 



5; 



Qy 

Db 



104 TGCCTGGTGCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATGTGTACA 163 

III III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
308 TT C CAT CT GAC CCACCT GAGC CATTGCCACACTT CCT CAT TGAGCC CGAGGAAGCTT ACA 367 



Qy 

Db 



164 TCGTCAAGAACAAGCCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCT 223 

I I I III III I I I I I III II I I I I I I I I I I I I I I I I I I I I I I I 

368 TT GTGAAGAACAAGC CT GT GAACCT GT AT T GT AAAGCCAGCCCTGCC AC CCAGAT CT ACT 427 



Qy 



224 TCAAGT GCAAC GGGGAGT GGGT GC GC CAGGT GGACCACGT GAT CGAGC GC AGC ACAGAC G 283 



1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 I III 1 1 1 1 1 1 1 1 1 III II 1 1 1 I 

428 T CAAGTGCAACAGCGAGT GGGTT C ATCAGAAG GAC CAC GTAGT AGAC GAGAGAGT AGAT G 487 

284 GGAGCAGT GGGCTGCCCACCATGGAGGTCCGCATTAAT GT CTCAAGGCAGCAGGT CGAGA 343 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

488 AAACCTCTGGTCTAATTGTGAGAGAAGTGAGCATTGAGATTTCACGCCAGCAGGTGGAGG 547 

344 AGGTGTTCGGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCA 403 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
54 8 AACTGTTTGGGCCTGAAGATTACTGGTGCCAGTGTGTGGCCTGGAGCTCAGCAGGCACTA 607 

404 CCAAGAGT CAGAAGGCCT ACAT C CGCAT AGC C AGATT GC GCAAGAACTTC GAGCAGGAGC 463 

I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

608 C GAAGAGT CGGAAGGCAT AC GT GCGCATT GC GT AT CT GCGGAAGAC ATT C GAGCAGGAAC 667 

464 CGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGG 523 

rill I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
668 CCTT GGGAAAGGAAGTGT CCT T GGAGCAGGAAGT CTT ACT C CAGT GT C GGCCAC CT GAAG 727 

524 GCATCCCTCCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGG 583 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

728 GGAT C CCAGT GGCT GAGGTGGAAT GGCTAAAGAAT GAAGAC AT AAT T GAT CCT GCT GAAG 787 

584 ACCCCAATGTATACATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTG 643 

II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

788 AT CGGAACTTTT AT ATT ACT AT C GAT CACAACCT GAT CAT CAAGCAAGCC CGACT CT CAG 847 

644 ACAC GGC CAACT ACACCT GCGT GGCCAAGAACAT C GT GGCACGT C GCC GC AGCGC CT C C G 703 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

848 AT ACAGCAAATT AT ACCTGT GTT GCCAAAAAT AT T GTT GCCAAGAGAAAAAGCAC CACAG 907 

704 CTGCTGTCATCGTCTACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCA 763 

I I I I I I I I I I I II II II I I I I I I I I I I II I I I I I I I I I I I I I II II I 
908 C CACT GT CAT C GT GT AT GTTAAT GGT GGCT GGT C CACCT GGAC AGAGT GGT CT GT GT GT A 967 

764 GCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTC 823 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
968 ACAGC C GCT GT GGGCGAGGAT AT C AGAAACGCACAAGAAC CTGCAC CAAC CCAGC CC C AC 1027 

824 TCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCACCCTGT 883 

I I I I II II II I I I I I I I I I I I I I I I I III 1111111111 III I II I I 
1028 T CAAT GGT GGGGCCT TCT GT GAGGGGCAGAGTGT GCAGAAAAT AGCAT GC ACT AC GTT AT 1087 

884 GCCCAGTAGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCA 943 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1088 GT CCAGT GGAT GGT AGGT GGACT T C AT GGAGCAAAT GGTCAACCT GT GGGACT GAAT GC A 1147 

944 CC C ACTGGC GGAGC C GT GAGT GCT CT GACCCAGC AC C C CGCAAC GGAGGG GAGGAGT GC C 1003 
I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
1148 CCCACT GGCGCAGGAGGGAGT GT ACAGCACCAGC CC C CAAGAAC GGGGGTAAGGACT GT G 1207 

1004 AGGGCACT GAC CT GGACACCCGCAACT GTAC CAGT GACCT CTGT GT AC ACAGT GCTT CT G 1063 

I I I I I I I I I II II II I II II I I I I III I I I I I I I 
1208 ATGGCCTGGTCCTCCAATCCAAGAACTGCACTGATGGGCTGTGCATGCAGGCTGCTCCTG 1267 

1064 GCCCTGAGGACGTGGCCCTCTATGTGGG CCTCATCGCCGTGGCCGTCTGCCTGGTCC 1120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 



1268 ACTCAGATGATGTGGCTCTCTACGTGGGGATTGTGATCGCTGTAACAGTCTGTCTGGCGA 1327 

1121 TGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATG 1180 

I I I I I I I I I I I I I I I 1 I I I I I I I I I I 

1328 TCACTGTTGTGGTGGCCCTGTTTGTGTATCGGAAGAACCACCGTGACTTTGAGTCTGACA 1387 

1181 T GGCT GACT C GT C C ATT CT CACCT CAGGCTT CCAGC C C GT CAGC AT CAAGC CCAGCAAAG 1240 

I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I 

1388 T CAT T GACT C CT C AGCACT CAAT GGCGGCT TT CAGC CT GT GAAC AT CAAG G 1438 

1241 CAGACAACCCCCATCTGCTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACC 1300 

I I I I I I I I I I I I III I I I I I I I I I I I I I III III 

1439 CT GC CAGACAAGAT CT C CT GGCT GT CCCCCCT GAC CT C AC CT CAGCT GC AGCCAT GT ACA 1498 

1301 AGGGCAGTCTCTGTCCCCGGCAGGATG GGC CCAGC CC CAAGTT C CAGCT CAC CAA 1355 

III I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I 

1499 GGGGAC CT GT CT AT GCT CT GC AT GATGT CT C AGACAAAAT CC CAAT GAC CAACT CT C CAA 1558 

1356 T GGGC ACCT GCT CAGC C C CCT GGGT GGCGGC CGC CACACACT GC AC CACAGCT CT CC C AC 1415 

I I I I I I I I I I I I I I I I I I I I I 

1559 TT CT GGACCCACT ACC CAACTTGAAAAT CAAAGT GTACAAC AGCT CAGGT GCT GT CACT C 1618 

1416 CTC TGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCC 1453 

III III I MINI III I I I I III 

1619 CT CAGGAT GAC CTT GC CGAGTTCT CAT CCAAACT GT C ACCCCAGAT GAC C C AGT C CT T GC 1678 

1454 AGAACT ACTT C C GCT CCCT GCCC C GAGGCAC CAGC A 1489 

I I I II I II I I I III I 

1679 T AGAGAAT GAGGCCCTTAACCTGAAGAACCAGAGC CTCGCAAGACAGACT GACC CAT CCT 1738 

1490 ACAT GACCT AT GGGACCT T CAACT T CCT C GGGGGC CGGCT GAT GAT C C CTAAT AC AGGT A 1549 

II I I III I I I I I I I I I I II I I I I I I II II II I I I I I I I I I I 

1739 GCACAGCATT TGGTACCTT CAACT CTCTT GGGGGT CACCT CAT CAT T C CTAAT T CAGGAG 1798 

1550 TC AGC CT C CTCAT CC CC C CAGAT GCCAT ACC C CGAGGGAAGAT CTAT GAGAT CT ACCT CA 1609 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

1799 TAAGCTTGCTGATTCCCGCTGGGGCCATTCCTCAGGGGAGAGTCTATGAAATGTATGTGA 1858 

1610 CGCTGCACAAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTC 1669 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1859 CT GT ACACAGGAAAGAAAAT ATGAGGCCCCC C AT GGAAGACT CT CAGACCCT ACTT AC CC 1918 

1670 CCATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGG 1729 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

1919 CTGTGGTGAGCTGTGGGCCTCCTGGAGCTCTGCTGACCCGCCCTGTCATCCTCACTCTGC 1978 

1730 ACCACTGTGGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCG 1789 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

1979 AT C ACT GT GC AGACC CC AGCACC GAGGACT GGAAGAT C CAGCT CAAAAAC C AGGCAGT GC 2038 

1790 AGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACT 1849 

I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I III 

2039 AGGGACAAT GGGAGGAT GTT GT GGT GGTT GGGGAGGAGAACTT CACAACCC C CT GTT AC A 2098 

1850 GC CAGCT GGAGGCCAGTGCCT GCT AC GT CTT CACCGAGCAGCTGGGCCGCTTTGC CCT GG 1909 

I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

2099 TT CAGCTGGATGCAGAGGCTT GCCAT AT CCT CACAGAGAACCT CAGT AC CT AT GCCCT GG 2158 



Qy 1910 TGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGG 1969 

III I I I I III I I I I I I I I I I I I I I II II I I II I I I I I 

Db 2159 TTGGGCAGTCCACCACCAAAGCAGCTGCCAAGCGTCTTAAACTGGCCATCTTTGGGCCCC 2218 

Qy 1970 T GGCCT GCAC CT C C CT CGAGT ACAAC AT C C GGGT CT ACT GCCTGC AT GAC AC C C AC GAT G 2029 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 2219 T CT GCTGCT CTT C C CTGGAGT ACAGCAT T AGAGT CT ACT GCCT GGAT GAC AC ACAGGA.T G 2278 

Qy 2030 CACT CAAGGAGGT GGT GCAGCT GGAGAAGCAGCT GGGGGGAC AGCT GAT C CAGGAGC C AC 2089 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2279 CCCT GAAGGAAGT TCT ACAACT GGAGAGGCAAAT GGGAGGACAGCT CCTAGAAGAAC C C A 2338 

Qy 2090 GGGT CCT GCACTT CAAGGAC AGT T AC C ACAAC CTGC GCCT AT CCAT CCAC GAT GT GCC C A 2149 

II I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II 
Db- 2339 AGGCTCTTCATTTTAAAGGCAGCAT C C ACAAC CTGC GC CT GT CT ATT CAT GACAT CGC C C 2398 

Qy 2150 GCT C CCT GT GGAAGAGTAAGCT CCT T GT CAGCT ACC AGGAGAT C CCCT TT TAT CACAT CT 2209 

I I I II I I I I I I I I II I II I I II I I I I I II II Mill I I II I I I 
Db 2399 ATT C CCTCT GGAAGAGCAAATT GCT GGCT AAGT AT C AGGAAATT CCAT TT T AC CACAT CT 2458 

Qy 2210 GGAATGGC ACGCAGC GGTACTT GCACT GCACCT TCACC CTGGAGCGT GT CAGC CC CAGCA 2269 

II I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I III 

Db 2459 GGAGT GGCT CTCAAAGAAAC CT CCACT GCACCT TCACT CTGGAAAGACTCAGC CT AAAC A 2518 

Qy 2270 CTAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCA 2329 

I II I I I I I I I I I II II III I I I I I I I II II II I I I I I I I MM 

Db 2519 C AGT GGAACT GGTTT GCAAACT CT GT GT GCGGC AGGTT GAAGGAGAAGGGCAGAT CTT C C 2578 

Qy 2330 GCAT CAACTT CAACAT CAC CAAGGAC ACAAGGT TT GCT GAGCTGCTGGCT CT GGAGAGT G 2389 

I I I I I I I I I I I I I II II II I I II I II 

Db 2579 AGCT CAACT GTACTGT GT C AGAGGAAC CT ACT GGCATC GACTTACCT CTCCTGGAC C CT G 2638 

Qy 2390 AAGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGC 2449 

III I I I I II I I I II I I II I I I I II I I I I I I I 

Db 2639 CT AGTAC CAT CAC CACT GT CACCGGACCAAGT GCTTTCAGCATT CCT CTCCCT AT C C GGC 2698 

Qy 2450 AGAAGATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGG 2509 

I I II I II I II I II I II III I III I I I I I I I II II I I 

Db 2699 AGAAGCT AT GCAGCAGCCT GGAT GC C CCT CAAACAAGAGGC CAT GACT GGAGGAT GCT GG 2758 

Qy 2510 C CCAGAAACT CCAC CT GGACAGCCAT CT CAGCT TCT TT GCCT CCAAGC C CAGC C C C ACAG 2569 

II I I I I II I I I I I I II I I I I I II I II I II I I I I I I I II II I I I I 

Db 2759 CCCATAAACT CAACCT GGACAGGT ACTT GAATT ACTTT GCCACCAAAT C GAGCC CAACT G 2818 

Qy 2570 CCATGATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGG 2629 

I I II I I I I I I I II I I I I I I II I I II I I I I I I II I I I I I I I II 
Db 2819 GCGTAAT CCT GGATCTTT GGGAAGCAC AGAACTT C C CAGAT GGAAACCT GAGCAT GCT GG 2878 

Qy 2630 CTGCAGCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTG 2689 

I I I I III I I I I I I I II II III I I I I I 

Db 2879 C AGCCGTCCT GGAAGAAAT GGGAAGAC AT GAGAC AGTGGTGT CCT T GGC AGCAGAAGGAC 2938 

Qy 2690 AGTGCTGA 2697 

III III 

Db 2939 AGT ATT GA 294 6 
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AY187310 

LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 

JOURNAL 
REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

FEATURES 

source 



CDS 



AY187310 2962 bp mRNA linear VRT 06-JUN-2003 

Gallus gallus UNC5-like protein 3 mRNA, complete cds . 

AY187310 

AY187310.1 GI:31442350 

Gallus gallus (chicken) 
Gallus gallus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Archosauria; Aves; Neognathae; Galliformes; Phasianidae; 
Phasianinae; Gallus. 

1 (bases 1 to 2962) 
Guan,W. and Condic,M.L. 

Characterization of Netrin-1, Neogenin and CUNC-5H3 expression 
during chick dorsal root ganglia development 
Gene Expr. Patterns 3, 369-373 (2003) 

2 (bases 1 to 2962) 
Guan,W. and Condic,M.L. 
Direct Submission 

Submitted (26-NOV-2002 ) Neurobiology & Anatomy, University of Utah, 
20 North, 1900 East, Salt Lake City, UT 84132-3401, USA 

Location/Qualifiers 

1. .2962 

/organism="Gallus gallus " 

/mol_type="mRNA" 

/db_xr e f = " t axon : 9 0 3 1 " 

1. .2796 

/codon_start=l 

/product="UNC5-like protein 3" 
/protein_id="AA067275.1" 
/db_xref="GI: 31442351" 

/translation="MGKGLEGTAARCGLGMGYLLHSVVLPALAVLGASRPGSAAQDDD 

FFHELPETFPSDPPEPLPHFLIEPEEAYIV1CNKPWLYCKASPATQIYFKCNSEWVHQ 

KDHWDERVDETSGLIVCEVSIEISRQQVEELFGPEDYWCQCVAWSSAGTTKSRKAYV 

RIAYLRKTFEQEPLGKEVSLEQEVLLQCRPPEGIPVAEVEWLKNEEVTDPVEDRNFYI 

TI DHNLI I KQARLSDTAN YTCVAKNI VAKRKSTTATVI VYVNGGWSTWTEWSACNS RC 

GRGFQKRTRTCTNPAPLNGGAFCEGQNVQKIACTTLCPVDGKWTSWSKWSTCGTECTH 

WRRRECTAPAPKNGGKDCEGLVLQSKNCTDGLCMQAAPDSDDVALYVGIVIAVIVCLA 

ISvVVALFvTRKNHRDFESDIIDSSALNGGFQPWIKAARQDLLAVPP 

GPWALHDVSDKIPMTNSPILDPLPNLKIKVYNTSGAVTPQDELSDFSSKLSPQITQS 

LLENETLNVKNQSLARQTDPSCTAFGTFNSLGGHLVIPNSGVSLLIPAGAVPQGRVYE 

MYVTVIiRKEGMRPPV^DSQTLLTPvVSCGPPGALLTRPvVLTMHHCAEP 

KHQAGQGPWEDWWGEENFTTPCYIQLDPEACHILTETLSTYALVGQSITKAAAKRL 

KLAI FGPLSCSSLEYSIRVYCLDDTQDALKEVLQLERQMGGQLLEEPKTLHFKGSTHN 

LRLSIHDIAHSLWKSKLPAKYQEIPFYHIWSGCQRNLHCTFTLERFSLNTLELVCKLC 

VRQVEGEGQIFQLNCSVSEEPTGIDYPIMDSAGSITTIVGPNAFSIPLPIRQKLCSSL 

DAPQTRGHDWRMLAHKLKLDRYLNYFATKSSPTGVILDLWEAQNFPDGNLSMLAAVLE 

EMGRHETWS LAAEGNY " 



ORIGIN 



Query Match 36.7%; 
Best Local Similarity t 62.6%; 
Matches 1658; Conservative 



Score 988.8; DB 5; 
Pred. No. 8e-160; 
0; Mismatches 927; 



Length 2962; 
Indels 63; 



Gaps 



5; 



Qy 104 TGCCTGGTGCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATGTGTACA 163 



I 1 1 1 II 1 1 1 1 I I 1 1 1 II 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 I 1 1 1 1 

158 TTCCTTCTGATCCTCCAGAGCCATTGCCCCACTTTCTCATTGAACCCGAAGAAGCTTACA 217 

164 TCGTCAAGAACAAGCCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCT 223 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

218 T CGT GAAAAACAAGC CTGT GAATCT GT ACTGCAAAGCGAGC CCT GCCAC GCAGAT CT ATT 277 

224 T CAAGTGCAACGGGGAGT GGGT GCGCCAGGTGGACCACGTGAT CGAGCGCAGCACAGACG 283 

I I I I I I I I I I I I I I I I I I I III I I I I I I II I I I II I I I I 

278 T T AAGTGCAAC AGT GAAT GGGT T CAT CAGAAGGAT CAT GT GGT GGAT GAGAGAGT AGAT G 337 

284 GGAGC AGT GGGCTGC CCACCAT GGAGGT C C GCATT AAT GT CTCAAGGCAGCAGGT CGAGA 343 

I I I I I I I I I I Mill Mil l III I II I I I I I I II 
338 AAAC CT CT GGT CT GAT CGT CT GT GAGGT GAGCAT C GAGATT T C C C GC CAGC AGGT GGAAG 397 

344 AGGTGTTCGGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCA 403 

I I I I I I I I I I II I I II I I II II II I I I II I I I I II I I I I I I I I I I I I 
398 AGCT CTT T GGACC CGAGGACT ACT GGT GC CAGT GT GT CGCCTGGAGCT CAGCTGGCACCA 457 

404 C CAAGAGT CAGAAGGC CT ACAT C C GCAT AGCCAGATT GCGCAAGAACT T C GAGC AGGAGC 4 63 

I I I I I I I I I I I II II I I I II II I I I I I I I I II I I II I I I II I I I 

458 CCAAGAGCCGCAAGGC CT AC GT CC GCATT GCAT AT CT CAGAAAGACTTT T GAGCAGGAGC 517 

464 CGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGG 523 

II I II I I I I I I I II I I I I I II II I I II I I II I I I I I I I I I I I I I I 

518 CGCTGGGGAAAGAAGTGTCCCTGGAGCAAGAGGTCCTGCTCCAGTGCCGTCCTCCTGAAG 577 

524 GCAT CCCT CCAGCC GAGGT GGAGT GGCT CC GGAAC GAGGAC CT GGT GGAC CCGT C CCT GG 583 

II I I II II I I I I I I I II I I I II I I I I I I I I I I I I I I I 

578 GCATT CCAGT AGCT GAGGT AGAGT G GCT GAAGAAT GAAGAGGT GAT C GAT C CT GT GGAAG 637 

584 ACCCCAATGTATACATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTG 643 

III I I I I I I I I I II I II I I I I I I I I I I I I I II I I I I I I I 

638 AC CGAAAT TTTT ACAT CACCAT T GAT C ACAAC CT GAT CAT CAAGCAAG C CC GGCT T T CC G 697 

644 ACAC GGC CAACT ACACCT GCGTGGC CAAGAACATCGT GGCACGT CGC CGCAGCGC CT CCG 703 

II I I I II I I I I I I II II I I I I I I I I II I I I II I I I I I I I I II 

698 ACAC GGCTAACTACAC CT GTGTT GC CAAAAACAT T GT GGC CAAAAGGAAAAGCAC GACAG 757 

704 CTGCTGTCATCGTCTACGTGAACGGTGGGTGGTCGACGTGGACCGAGT GGT CCGT CTGCA 763 

I II II I I I I I I I I I II I I I I I I II II I I I II I I I II I II I II I I II I 

758 CAACT GT GAT T GT CT ATGT GAATGGAGGCT GGT CTACCT GGAC CGAGT GGT CAGC GT GCA 817 

764 GCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTC 823 

I I I I I I II I I I I I II I II I I I I I I I I I M I I I II I I I I I I I I 
818 ACAGC CGCTGT GGGAGAGGCTT CCAGAAGC GCACAAGGACCTGCACTAACCCTGCC C CAC 877 

824 TCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCACCCTGT 883 

II II I I I I I II I I II I I I II I I I I II I II I I I I II I III III I I I I II I I I 

878 TCAATGGGGGGGCCTTCTGCGAGGGGCAAAATGTTCAGAAAATAGCTTGCACCACCCTGT 937 

884 GCCCAGTAGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCA 943 

I I I I I I II I I I I I I I I I II II II I II I I I I f I I I I I I II II I 

938 GT CCAGT GGAT GGCAAAT GGAC GT CCT GGAGCAAGT GGT C CACTT GT GGCACAGAGT GT A 997 

944 CC CACTGGCGGAGC C GT GAGT GCT CT GACCCAGCACCCCGCAACGGAGGGGAGGAGT GC C 1003 

II I I I II II I I I I I I I II I I II I I I I I I II I I I I I I I I I 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 



998 CCCACTGGCGCCGGAGGGAGTGCACAGCTCCGGCCCCGAAGAATGGAGGCAAGGACTGTG 1057 

1004 AGGGC AC T GAC CT GGAC AC C C GC AAC T GT AC C AGT G AC CT CT GT GT AC AC AGT GCT T CT G 1063 

I I I I I I I I I I I I I I I IK II I I I I I III III III 

AGGGACT GGT GCT GCAGT CTAAGAACT GCACT GAT GGGCTCT GC ATGCAGGCT GCAC CT G 1117 



1058 



1120 



1064 GCCCTGAGGACGTGGCCCTCTATGTGGG CCTCATCGCCGTGGCCGTCTGCCTGGTCC 

I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I 

1118 ACTCGGATGATGTTGCTCTCTACGTGGGGATTGTCATTGCTGTGATTGTGTGCCTGGCTA 1177 

1121 TGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATG 1180 

I I I I I I I II I I I I I I I I III I I I I I I I I I I I 

1178 TTTCTGTGGTTGTGGCCCTGTTTGTCTATCGCAAGAACCACCGTGACTTTGAGTCAGATA 1237 

1181 TGGCTGACTCGTCCATTCTCACCTCAGGCTTCCAGCCCGTCAGCATCAAGCCCAGCAAAG 124 0 

I I I I I I I I III I I I I I I I I I I I I I I I I I I I I II 

1238 TTAT CGACT CAT CGGC GCTAAATGGGGGATTT C AGC CT GTTAACATCAAGGCT GCAAGAC 1297 

1241 CAGACAACCCCCATCTGCTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACC 1300 

I I I I II I I II I I I I I I I I I I I I III III 

1298 AAGAC CT CTT GGCAGT GCC ACCAGACCT CACTT CTGCT GCAGC CAT GTACA 1348 

1301 AGGGCAGTCTCTGTCCCCGGCAGGATG GGC C CAGCCC CAAGTT CCAGCT CAC CAA 1355 

III I I I I II I I I I I I I I I I I I I I III I I I I I 

1349 GGGGGCCTGTGTATGCCTTGCATGATGTCTCTGATAAAATCCCAATGACCAATTCTCCGA 1408 

1356 T GGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACACACTGCACCACAGCTCTC 1411 

I I I I I I I I I I II I I I I I III 
1409 T CCT GGACCCACT GC C CAATCT GAAGATTAAAGT TT ATAACACCT CT GGAGCAGT CACC C 1468 

1412 CCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCC 1453 

II III I I I I I I I I I I I I I I I I I 

1469 CCCAGGATGAACT CT CTGACTT CT C CT CCAAGCT GT CCCCACAGATT ACCCAGT CT CT GT 1528 

1454 AGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCA 1489 

I I I I I I II I I I I I I I I I 

1529 T GGAGAATGAGACTCT GAACGT GAAGAAC CAAAGC CTT GCAC GGCAAACAGAC CCAT CCT 1588 

1490 ACATGACCTATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTA 154 9 

I I I I I II I I I I I I I I I I I I I I I I I I I II III II M I I I I I I 

1589 GCACT GCATTT GGGAC CTT CAACT C GTTAGGGGGC CACCTAGTAATT CCTAATTCAGGAG 1648 

1550 T CAGCCTCCT CAT CC C C CCAGAT GCC AT AC CCC GAGGGAAGAT CT AT GAGATCTACCTCA 1609 s 

I I I I I I I II I I I III II I I I I I I I I I I I I I I I I I I I I II 
1649 T GAGCTTGCT GAT CC CAGCAGGGGCT GTT CC C CAAGGAAGAGTCT AT GAAATGT AT GTGA 1708 

1610 CGCTGCACAAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTC 1669 

I I I I I I I I I I I I I I I I II III I I I I I I I I I I I I I I I I 

1709 CAGTCCACAGGAAGGAGGGCATGAGACCACCTGTAGAAGACAGCCAGACGCTGCTGACAC 1768 

1670 CCATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGG 1729 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1769 CAGTGGTGAGCTGTGGCCCACCAGGAGCGCTGCTGACCCGACCCGTTGTGCTGACCATGC 1828 

1730 ACCACTGTGGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCG 1789 

I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I II 

1829 ACCACT GTGCTGAGCC CAACAT GGAT GACT GGCAGAT CCAGCTCAAGCAC CAGGC AGGCC 1888 



Qy 1790 AGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACT 1849 

I I I I I I I I I I I I I I I II I I I I I I I I III I I I I I I 

Db 1889 AGGGAC CAT GGGAGGAT GT AGT GGT GGT C GGGGAGGAAAACT T C AC CACT CCAT GCT ACA 1948 

Qy 1850 GCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGG 1909 

I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I 

Db 1949 T C C AGCT GGACCC AGAGGC CT GT CAT AT C CT GAC GGAGACC CT C AGCAC GT ACGC CTT GG 2008 

Qy 1910 TGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGG 1969 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II 

Db 2009 T GGGACAAT C CAT CACC AAAGCAGCAGCCAAAC GT CT CAAAT T GGCCAT CTT T GGAC CAC 2068 

Qy 1970 T GGC CT GCAC CT C CCTCGAGT ACAACAT CCGGGT CT ACT GC CT GC AT GACAC CCACGAT G 2029 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2069 T GT C CT GT T CCT CACT GGAGT ACAGCAT CCGCGT CT ACT GCCTCGAT GACACACAGGAT G 2128 

Qy 2030 CACT CAAGGAGGT GGT GCAGCT GGAGAAGCAGCT GGGGGGAC AGCT GAT C CAGGAGC CAC 2089 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2129 CC CT GAAGGAGGTC CT C C AGCTTGAGCGGCAGAT GGGT GGGCAG CT GTT GGAGGAAC CCA 2188 

Qy 2090 GGGT CCTGCACTT CAAGGACAGT T AC CACAACCT GC GC CTATC CAT CCAC GAT GT GC C CA 2149 

I I I I I I I I I I III I I II I I I I I I I I I I I I I I I I I I I I I II 
Db 2189 AAACTTT GCATTTTAAGGGAAGT AC C CACAACCT GC GCT TAT C CAT T CAT GACATT GC C C 2248 

Qy 2150 GCT C CCT GT GGAAGAGTAAGCT CCTT GT C AGCT AC C AGGAGAT C C C CTTTT AT CACAT CT 2209 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I 

Db 2249 ACT CT CT CT GGAAGAGCAAACT GCCGGCTAAAT ACC AGGAGATT C CTTT TT ACCAC AT CT 2308 

Qy 2210 GGAATGGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCA 2269 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2309 GGAGTGGGT GC CAGAGGAACTT GCACTGCACCTT CACGCT GGAACGATT CAGTCT CAATA 2368 

Qy 2270 CT AGTGACCT GGC CT GCAAGCT GT GGGT GT GGCAGGTGGAGGGC GAC GGGCAGAGCT T CA 2329 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2369 CC CT GGAGCT CGT CT GCAAACT CT GT GT GC GGCAAGTC GAAGGAGAAGGGC AGAT CT T CC 2428 

Qy 2330 GCAT CAACTT CAACATCAC CAAGGACACAAGGTTT GCT GAGCT GCT GGCT CT GGAGAGTG 2389 

I I I I I I I I I I I I I I III I MM I 

Db 2429 AGCTGAACTGCTCAGTATCAGAGGAACCCACTGGCATT GATTATCCCATCATGGATT CAG 2488 

Qy 2390 AAGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGC 2449 

II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II III 

Db 2489 CAGGCAGCAT CACAACGAT AGTTGGGCC CAACGCTTTCAGCAT CCC C CT CCCAATAAGGC 2548 

Qy 2450 AGAAGATAAT TT C CAGC CT GGACC C ACC CT GT AGGC GGGGT GC C GACT GGCGGACT CT GG 2509 

I I I I I I I I I I I I II I I II II I II I I I I I I I II I I I I I II 

Db 2549 AGAAGCT CT GCAGC AGC CT GGAT GC ACC C C AGAC C C GGGGCCAT GACTGGAGGAT GCT GG 2608 

Qy 2510 CCCAGAAACT CCAC CT GGACAGCCATCT CAGCT T CT TT GCCT C CAAGCCCAGCCC CAC AG 2569 

I I I I I I II I I I I I I I I I I I I I I II I I I II I I II II I I I I 
Db 2609 CC CACAAGCT GAAATTGGACAGGT AC CTAAATT ATTTT GCT AC GAAGTCGAGTCC C ACT G 2668 

Qy 2570 CCATGATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGG 2629 

II II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II II 

Db 2669 GGGTGATCCTGGATCTCTGGGAAGCCCAGAATTTCCCTGATGGCAACCTGAGCATGCTGG 2728 



Qy 2630 CTGCAGCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTG 2689 

I I I I I III I I I I I I I I II II II I I I I I 

Db 2729 CAGCAGTGCTGGAAGAAAT GGGACGAC AT GAAACC GTTGTTT CTT T GGC AGCAGAAGGAA 2788 

Qy 2690 AGTGCTGA 2697 

I I I I I I 
Db 2789 ATTACTGA 2796 



Search completed: March 6, 2005, 05:25:12 
Job time : 11476.2 sees 



GenCore version 5.1.6 
Copyright (c) 1993 - 2005 Compugen Ltd. 



OM nucleic - nucleic search, using sw model 
Run on: 



March 5, 2005, 14:42:51 ; Search time 1373 Seconds 

(without alignments) 
11628.216 Million cell updates/sec 



Title: 

Perfect score: 
Sequence : 

Scoring table: 



US-10-624-932-l_COPY_46_2742 
2697 

1 atggccgtccggcccggcct 



, tgtcggaggctgagtgctga 2697 



IDENTITY_NUC 

Gapop 10.0 , Gapext 1.0 



Searched: 4390206 seqs, 2959870667 residues 

Total number of hits satisfying chosen parameters: 



8780412 



Minimum DB seq length: 
Maximum DB seq length: 



2000000000 



Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 



Database 



N_Geneseq_16Dec04 : ■ 



1 
2 
3 
4 
5 
6 
7 
8 
9 

10 
11 
12 
13 



geneseqnl980s : * 
geneseqnl990s : * 
geneseqn2000s : * 
geneseqn2001as : * 
geneseqn2001bs : * 
geneseqn2002as : * 
geneseqn2002bs : * 
geneseqn2003as : * 
geneseqn2003bs : * 
geneseqn2003cs : * 
geneseqn2003ds : * 
geneseqn2004as : * 
geneseqn2004bs : * 



Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 



SUMMARIES 



% 

Result Query 

No. Score Match Length DB ID 



Description 



1 2697 100.0 

2 2697 100.0 

3 2687.4 99.6 

4 2621.4 97.2 



2752 6 ABK37922 

2752 12 ADH71617 

2697 6 ABK52891 

2881 6 ABK49422 



Abk37922 cDNA enco 

Adh71617 Human gen 
Abk52891 Human net 
Abk49422 DNA encod 
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ALIGNMENTS 



RESULT 1 
ABK37922 

ID ABK37922 standard; cDNA; 2752 BP. 
XX 

AC ABK37922; 
XX 

DT 21-MAY-2002 (first entry) 
XX 

DE cDNA encoding Human protein N0V1 . 
XX 

KW Human; NOVX; ss; gene; cardiomyopathy; atherosclerosis; diabetes; 



KW cell signal processing disorder; metabolic disorder; obesity; infection; 

KW anorexia; cancer-associated cachexia; cancer; neurodegenerative disorder; 

KW Alzheimer's disease; Parkinson's disease; immune disorder; 

KW haematopoietic disorders; dyslipidaemia; pain; asthma; hypertension; 

KW osteoporosis; Crohn's disease; multiple sclerosis; angina pectoris; 

KW myocardial infarction; ulcer; allergy; benign prostatic hypertrophy; 

KW psychosis; neurological disorder; anxiety; schizophrenia; 

KW manic depression; dementia; dyskinesia; Huntington's disease; 

KW Gilles de la Tourette ' s syndrome; gene therapy. 

XX 

OS Homo sapiens . 
XX 

PN WO200210216-A2. 
XX 



PD 


07 


-FEB- 


■2002. 






XX 












PF 


30 


-JUL- 


•2001; 


2001WO- 


US024225. 


XX 












PR 


28 


-JUL- 


■2000; 


2000US- 


0221409P. 


PR 


04 


-AUG- 


■2000; 


2000US- 


0222840P. 


PR 


04 


-AUG- 


■2000; 


2000US- 


0223752P. 


PR 


04 


-AUG- 


-2000; 


2000US- 


0223762P. 


PR 


04 


-AUG- 


-2000; 


2000US- 


0223769P. 


PR 


04 


-AUG- 


-2000; 


2000US- 


0223770P. 


PR 


14 


-AUG- 


-2000; 


2000US- 


0225146P. 


PR 


15 


-AUG- 


-2000; 


2000US- 


0225392P. 


PR 


15 


-AUG- 


-2000; 


2000US- 


0225470P. 


PR 


16 


-AUG- 


-2000; 


2000US- 


0225697P. 


PR 


01 


-FEB- 


-2001; 


2001US- 


0263662P. 


PR 


05 


-APR- 


-2001; 


2001US- 


0281645P. 



XX 

PA (CURA-) CURAGEN CORP. 
XX 

PI Padigaru M, Mezes P, Mishra V, Burgess C, Gasman S, Grosse WM; 

PI Alsobrook JP, Lepley DM, Gerlach VL, Macdougall JR, Smithson G; 
XX 

DR WPI; 2002-180074/23. 

DR P-PSDB; AAU85403. 
XX 

PT New isolated cytoplasmic, nuclear, membrane bound, or secreted 

PT polypeptide, useful for treating cardiomyopathy, atherosclerosis, 

PT infections, cancer, neurodegenerative, metabolic, hematopoietic and 

PT immune disorders. 
XX 

PS Claim 9; Page 9-10; 213pp; English. 
XX 

CC The invention relates to an isolated cytoplasmic, nuclear, membrane 

CC bound, or secreted polypeptide (NOVX, x= 1-14) their variants or mature 

CC form. Also included are the nucleic acids encoding the NOVX proteins, a 

CC vector comprising the nucleic acid,' a cell comprising the vector, an anti 

CC -NOVX antibody and modulators of NOVX. NOVX, the nucleic acid and the 

CC antibody are useful for treating or preventing a NOVX-associated 

CC disorder, where the disorder is selected from cardiomyopathy, 

CC atherosclerosis, diabetes, a disorder related to cell signal processing 

CC and metabolic pathway modulation, metabolic disorders, obesity, 

CC infectious disease, anorexia, cancer-associated cachexia, cancer, 

CC neurodegenerative disorders, Alzheimer's disease, Parkinson's disease, 



CC immune disorders , haematopoietic disorders, and the various 

CC dyslipidaemias, metabolic disturbances associated with obesity, the 

CC metabolic syndrome X and wasting disorders associated with chronic 

CC diseases, bacterial, fungal, protozoal and viral infections, pain, 

CC bulimia, asthma, hypertension, urinary retention, osteoporosis, Crohn's 

CC disease, multiple sclerosis, Albright Hereditary Osteodystrophy, angina 

CC pectoris, myocardial infarction, ulcer, allergy, benign prostatic 

CC hypertrophy, and psychotic and neurological disorders, including anxiety, 

CC schizophrenia, manic depression, delirium, dementia, and dyskinesias, 

CC such as Huntington's disease and Gilles de la Tourette 1 s syndrome. The 

CC nucleic acid is useful in gene therapy. The present sequence encodes a 

CC NOVX protein 

XX 

SQ Sequence 2752 BP; 505 A; 937 C; 829 G; 481 T; 0 U; 0 Other; 



Query Match 100.0%; Score 2697; DB 6; Length 2752; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2697; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 



Qy 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 

I I I I I I I I I I I I i I I II ! I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 46 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 105 

Qy 61 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 120 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 106 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 165 

Qy 121 GACCT GCTT CCCCACTT CCT GGT GGAGC CCGAGGAT GTGTACATC GTCAAGAACAAGCCA 180 

i i i ii 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 166 GACCT GCTT CCCCACTT CCT GGT GGAGC CCGAGGAT GTGTACATC GTCAAGAACAAGCCA 225 

Qy 181 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I II I I I I I I 

Db 226 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 285 

Qy 241 T GGGT GCGCC AGGT GGAC CACGT GATC GAGCGCAGCACAGACGGGAGC AGT GGGC T GCC C 300 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I 

Db 286 TGGGT GCGCCAGGT GGAC CAC GT GATC GAGCGCAGCACAGACGGGAGCAGT GGGCT GCC C 345 

Qy 301 AC CAT GGAGGT CCGCATTAAT GT CT CAAGGCAGCAGGT C GAGAAGGT GTTC GGGCT GGAG 360 

II I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I 

Db 346 AC CAT GGAGGT CCGCATTAAT GT CT CAAGGCAGCAGGT C GAGAAGGT GTT CGGGCT GGAG 405 



Qy 361 GAAT ACTGGTGCCAGTGCGT GGCAT GGAGCT CCT CGGGCACCACCAAGAGT C AGAAGGC C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 406 GAATACTGGTGCCAGT GCGT GGCAT GGAGCT CCT C GGGCAC CAC CAAGAGT C AGAAGGC C 465 

Qy 421 TACAT CCGCAT AGC CAGATT GCGCAAGAACT TC GAGCAGGAGC CGCT GGC CAAGGAGGT G 4 80 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 466 TACAT CCGCAT AGC CAGATT GCGCAAGAACTT C GAGCAGGAGCCGCTGGCCAAGGAGGT G 525 



Qy 481 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 526 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 585 



Qy 



541 GT GGAGTGGCT CCGGAACGAGGAC CT GGT GGACCCGT C C CTGGACC CCAAT GT AT AC AT C 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



600 



586 GTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATC 64 5 

601 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 660 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I II 
646 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 705 

661 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
706 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 765 

721 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
766 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 825 

781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 84 0 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
826 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 885 

841 TGTGAGGGGCAGAAT GT CCAGAAAACAGCCT GC GCC ACC CTGT GCC CAGT AGAC GGCAGC 900 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
886 T GTGAGGGGCAGAAT GT CCAGAAAACAGCCT GC GCC AC C CTGT GCCCAGT AGAC GGCAGC 945 

901 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
946 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 1005 

961 GAGTGCTCT GAC CCAGCACC CCGCAAC GGAGGGGAGGAGT GCC AGGGCACT GAC CT GGAC 1020 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
1006 GAGTGCTCT GAC CCAGCAC C C CGCAAC GGAGGGGAGGAGT GCC AGGGCACT GACCT GGAC 1065 

1021 ACCCGCAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1066 ACCCGCAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCC 1125 

1081 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1140 

I I I I I I I I I I I II I I II I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1126 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1185 

1141 CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 1200 

I I I I I I I I II I I I I I I I I III I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1186 CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 1245 

1201 ACCTCAGGCTT C CAGCCCGT CAGC AT CAAGCCCAGCAAAGCAGACAACC CCC AT CTGCT C 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1246 ACCTCAGGCTT C CAGCCCGT CAGC AT CAAGC C CAGCAAAGCAGACAACC CC C AT CT GCT C 1305 

1261 AC CAT C CAGCC GGACCT CAGCACC ACC ACCACCACCT AC C AGGGCAGT CT CT GT C CC C GG 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1306 ACCAT CCAGCCGGACCT C AGCAC CACCACCAC CACCT ACCAGGGCAGT CTCTGTCCCCGG 1365 

1321 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCT GCT CAGC CCCCTGGGT 1380 

I I I I I I I I I I I I I I I I I I I I I J I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1366 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1425 

1381 GGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCC 144 0 

I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I 
1426 GGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCC 1485 



Qy 1441 CGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTAT 1500 

I I I I I I I II I I I I I 1 I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1486 CGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTAT 1545 

Qy 1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1560 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1546 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1605 

Qy 1561 AT CCCCCCAGATGCCATACCCCGAGGGAAGAT CTAT GAGATCT ACCTCACGCTGCACAAG 1620 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ' 
Db 1606 AT C CC CCCAGAT GC CATAC CCCGAGGGAAGAT CTAT GAGAT CT ACCT CAC GCT GC ACAAG 1665 

Qy 1621 CC GGAAGACGT GAGGTT GC CCCT AGCT GGCT GT CAGAC CCT GCT GAGT CC CAT C GTT AGC 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1666 CC GGAAGACGT GAGGTT GC CCCT AGCT GGCT GT CAGAC C CT GCT GAGT CC CAT CGTT AGC 1725 

Qy 1681 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1726 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1785 

Qy 1741 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1786 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1845 

Qy 1801 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II II I I I I I I II I I I I I II I 
Db 1846 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1905 

Qy 1861 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1906 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1965 

Qy 1921 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 1966 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 2025 

Qy 1981 T CCCTC GAGT ACAACATC CGGGTCT ACT GC CT GCAT GACAC CC ACGAT GC ACTCAAGGAG 2040 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2026 T CCCTCGAGT ACAACATC CGGGT CTACTGC CT GCAT GACAC CC ACGAT GC ACTCAAGGAG 2085 

Qy 2041 GT GGT GCAGCT GGAGAAGCAGCTGGGGGGAC AGCT GAT CCAGGAGC CACGGGTCCTGCAC 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II II I I I II I I I 
Db 2086 GT GGT GCAGCT GGAGAAGCAGCT GGGGGGACAGCT GAT CCAGGAGC CAC GGGT CCT GCAC 2145 

Qy 2101 TT CAAGGACAGTT AC CACAAC CT GC GC CT AT CCAT CCACGATGT GC CC AGCT CCCT GT GG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2146 TT CAAGGACAGT T ACCACAACCT GCGC CTAT C CAT C CAC GAT GT GCCC AGCT CCCT GT GG 2205 

Qy 2161 AAGAGT AAGCT C CTT GT CAGCT ACCAGGAGAT C C C CT T T T ATCACAT CT GGAAT GGCACG 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2206 AAGAGT AAGCT CCTT GT CAGCT ACCAGGAGAT C C C CTTTTATCACAT CT GGAAT GGCACG 2265 

Qy 2221 CAGC GGT ACTT GCACT GCACCTT CAC CCT GGAGCGT GT CAGCC C CAGCACT AGT GAC CT G 2280 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2266 CAGCGGT ACTT GCACT GCACCTT CAC C CT GGAGC GT GT CAGCC C CAGCACT AGT GACCT G 2325 



Qy 

Db 



2281 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
2326 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 



2340 



2385 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



2341 AACATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTC 2400 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2386 AACAT CACCAAGGACACAAGGTTT GCT GAGCT GCT GGCT CT GGAGAGT GAAG CGGGGGT C 2445 

2401 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATT 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2446 CCAGC C CTGGT GGGCC C CAGT GCCTT CAAGAT C C C CT T C CT C AT T CGGC AGAAGATAATT 



2461 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

2506 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 



2505 



2520 



2565 



2521 CACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTC 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2566 CACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTC 2625 

2581 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2640 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
2626 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2685 

2641 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2697 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2686 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2742 
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Human gene of the invention NOV21e SEQ ID NO: 513. 

ds; gene; human; cytostatic; immunomodulator ; neuroprotective; nootropic; 
anorectic; antidiabetic; antimicrobial; antilipaemic; gene therapy; 
vaccine; cancer; cachexia; Alzheimer's disease; Parkinson's disease; 
obesity; diabetes; infectious disease; metabolic syndrome X; 
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Homo sapiens . 
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(CURA-) CURAGEN CORP. 

Alsobrook JP, Alvarez E, Anderson DW, Boldog FL, Casman SJ; 
Catterton E, Chapoval A, Crabtree-Bokor JR, Edinger SR, Ellerman K; 
Ettenberg S, Gangolli EA, Gerlach VL, Gorman L, Gunther E, Guo X; 
Gusev VY, Herrmann JL, Ji W, Kekuda R, Li L, Liu X, Macdougall JR; 
Maclachlan T, Malyankar UM, Mezick AJ, Millet I, Mishra VS; 
Padigaru M, Patturajan M, Pena CEA, Peyman JA, Raha D, Rastelli L; 
Rothenberg ME, Sciore P, Shenoy SG, Shimkets RA; 
Spytek KA, Stone DJ, Vernet CAM, Voss EZ, Zhong M; 



Rieger DK, 
Smithson G, 
Zhong H; 



WPI; 2004-081935/08. 
P-PSDB; ADH71618. 

New NOVX polypeptides and nucleic acid molecules useful for preventing or 
treating NOVX-associated disorders, e.g. cancer, diabetes, infection or 
obesity, and in chromosome mapping, tissue typing or pharmacogenomics. 

Example 21; SEQ ID NO 513; 1880pp; English. 

The invention relates to a novel isolated polypeptide (NOVX) . A 
polypeptide of the invention has cytostatic, immunomodulator, 
neuroprotective, nootropic, anorectic, antidiabetic, antimicrobial, and 
antilipaemic activity, and may have a use in gene therapy, and as a 
vaccine. The polypeptides are encoded by NOVX polynucleotides comprising 
any of the 303 fully defined nucleotide sequences given in the 
specification. The polypeptide is useful in the manufacture of a 
medicament for treating a syndrome associated with a human disease. The 
polypeptide, polynucleotide and antibody are useful in diagnosing, 
treating or preventing NOVX-associated disorders, e.g. cancer, cachexia, 
Alzheimer's disease, Parkinson's disease, obesity, diabetes, infectious 
diseases, metabolic syndrome X or dyslipidaemias . The nucleic acids are 
further used as hybridisation probes, in chromosome mapping, tissue 
typing, preventive medicine, and pharmacogenomics. The present sequence 
encodes a NOVX polypeptide of the invention. 

Sequence 2752 BP; 505 A; 937 C; 829 G; 481 T; 0 U; 0 Other; 



Query Match 

Best Local Similarity 



100.0%; 
100.0%; 



Score 2697; DB 12; Length 2752; 
Pred. No. 0; 



Matches 2697; Conservative 0; Mismatches 0; Indels 0; Gaps 



0; 



Qy 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I II I I I I I I I 
Db 46 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 105 

Qy 61 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I II I I I I I I I I I I I I I I I I I 

Db 106 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 165 

Qy 121 GACCT GCT T CCCCACTT CCT GGT GGAGC C CGAGGAT GT GT AC AT CGT CAAGAACAAGC CA 180 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 166 GAC CT GCT T CCCCACT T CCT GGT GGAGC C CGAGGAT GT GT AC AT CGT CAAGAACAAG C CA 225 

Qy 181 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 226 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 285 

Qy 241 T GGGT GCGCCAGGT GGACCACGT GATC GAGC GCAGCACAGACGGGAGCAGT GGGCTGC C C 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 286 T GGGT GCGCCAGGT GGAC CACGT GATCGAGCGC AGCACAGACGGGAGCAGT GGGCT GC C C 345 

Qy 301 AC CAT GGAGGTCCGCATTAAT GT CT CAAGGCAGC AGGT C GAGAAGGT GTT C GGGCT GGAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 346 AC CAT GGAGGTCCGCATTAAT GT CT CAAGGCAGCAGGT C GAGAAGGT GTT C GGGCT GGAG 405 

Qy 361 GAAT ACTGGT GCCAGT GCGT GGCAT GGAGCTCCT C GGGCACCAC CAAGAGT CAGAAGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 406 GAAT ACTGGT GCCAGT GCGT GGCAT GGAGCT CCT C GGGCAC C AC CAAGAGT CAGAAGGC C 465 

Qy 421 T ACAT CCGCATAGC CAGATT GCGCAAGAACTT CGAGCAGGAGC C GCT GGCCAAGGAGGT G 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 466 T ACAT CCGCATAGC CAGATT GCGCAAGAACT T CGAGCAGGAGC C GCT GGCCAAGGAGGT G 525 

Qy 481 T CCCT GGAGCAGGGCAT CGT GCT GC C CT GCCGT C CAC C GGAGGGC AT C C CT C CAGC C GAG 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 526 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 585 

Qy 541 GTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATC 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 586 GT GGAGTGGCT C CGGAACGAGGACCT GGT GGACC C GT C C CT GGAC C CCAAT GT AT ACAT C 645 

Qy 601 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 660 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I 
Db 646 ACGC GGGAGCACAGCCT GGT GGT GC GACAGGCCC GC CT T GCT GACAC GGC CAACT ACAC C 705 

Qy 661 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 706 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 765 

Qy 721 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 766 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 825 

Qy 781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 826 GGCTGGCAGAAACGGAGCC GGAGCT GCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 885 



Qy 841 TGT GAGGGGCAGAAT GT CC AGAAAAC AGCCT GC GCC ACC CTGT GC C C AGT AGAC GGCAGC 900 

I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 886 TGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGC 945 

Qy 901 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 960 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 946 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 1005 

Qy 961 GAGTGCT CT GACC CAGC AC CC C GCAAC GGAGGGGAGGAGT GCCAGGGCACT GAC CT GGAC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1006 GAGT GCT CT GACCCAGCACCC C GCAAC GGAGGGGAGGAGT GCCAGGGCACT GAC CT GGAC 1065 

Qy 1021 ACCCGCAACT GT ACC AGT GAC CT CT GT GTACACAGT GCTT CT GGC C CT GAGGACGT GGC C 1080 

I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1066 ACCCGCAACT GT ACCAGT GAC CT CT GT GTACACAGT GCTT CT GGC CCT GAGGAC GT GGCC 1125 

Qy 1081 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1140 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1126 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1185 

Qy 1141 CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I 
Db 1186 CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 1245 

Qy 1201 ACCTC AGGCTT CC AGCCC GT CAGCAT CAAGCC C AG CAAAGCAGACAAC CCCCAT CT GCT C 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1246 ACCTCAGGCTT CCAGCC C GT CAGCAT CAAGC C CAGCAAAGCAGACAAC CC CC AT CT GCT C 1305 

Qy 1261 AC CAT CCAGCC GGAC CT C AGCAC CACC AC CAC CACCT ACCAGGGCAGT CT CT GT CC C CGG 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1306 ACCAT CCAGCCGGACCT C AGCAC CACC AC CAC CACCT AC CAGGGCAGT CT CT GT CC C CGG 1365 

Qy 1321 CAGGAT GGGCC CAGCCC CAAGTT CCAGCT C ACCAAT GGGCAC CT GCT CAGC CC C CT GGGT 1380 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1366 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAAT GGGCAC CTGCTCAGCCCCCT GGGT 1425 

Qy 1381 GGCGGC CGCCACACACT GC ACCACAGCT CT C C CAC CT CT GAGGCCGAGGAGTT C GT CT C C 1440 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1426 GGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCT GAGGCCGAGGAGTT CGTCTCC 1485 

Qy 1441 CGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTAT 1500 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1486 CGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTAT 1545 

Qy 1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1546 GGGACCTT CAACTT C CTC GGGGGC C GGCTGAT GATC C CTAAT ACAGGTAT CAGC CT CCT C 1605 

Qy 1561 AT CCCCCCAGATGCCATACCCCGAGGGAAGATCTAT GAGATCTACCTCACGCTGCACAAG 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1606 AT C CCCCCAGAT GCCATACCC CGAGGGAAGATCT AT GAGATCT ACCT CACGCT GCACAAG 1665 

Qy 1621 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 1666 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1725 



Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 



1681 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I 
1726 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1785 

1741 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I 
1786 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1845 

1801 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1860 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

184 6 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1905 

1861 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1906 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1965 

1921 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 1980 

I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
1966 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 2025 

1981 TCCCTCGAGTACAACATCCGGGTCTACT GCCTGCATGACACCCACGAT GCACTCAAGGAG 204 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2026 T C C CT CGAGT ACAACAT CCGGGT CT ACT GCCT GC AT GAC AC CCACGAT GCACT CAAGGAG 2085 

2041 GT GGT GC AGCT GGAGAAGCAGCT GGGGGGACAGCTGAT CC AGGAGCCACGGGT CCT GCAC 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
2086 GTGGT GCAGCT GGAGAAGCAGCT GGGGGGACAGCT GAT CC AGGAGC CACGGGTCCT GCAC 2145 

2101 TTCAAGGACAGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGG 2160 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I 
2146 TT CAAGGAC AGT T ACCACAACCT GCGC CTAT CCAT CCACGAT GT GC CCAGCTCCCT GT GG 2205 

2161 AAGAGTAAGCT C CT T GT C AGCTACCAGGAGATCC CCT TTT ATCACAT CTGGAAT GGC AC G 222 0 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
2206 AAGAGTAAGCTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACG 2265 

2221 CAGC GGTACTT GCACT GCACCTT CACCCTGGAGC GT GT C AGCCC CAGCACTAGT GAC CT G 2280 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2266 CAGC GGT ACTT GCACT GCAC CT T CACCCTGGAGCGT GT CAGCCC CAGCACTAGT GAC CT G 2325 

2281 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 234 0 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2326 GC CT GCAAGCT GT GGGT GTGGCAGGT GGAGGGC GACGGGCAGAGCT TCAGCAT CAACT T C 2385 

2341 AACAT CAC CAAGGAC ACAAGGTTT GCTGAGCTGCT GGCTCT GGAGAGT GAAGCGGGGGT C 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2386 AACAT CAC CAAGGAC ACAAGGTT T GCT GAGCTGCT GGCT CT GGAGAGT GAAGCGGGGGT C 2445 

2401 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATT 2460 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2446 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCCGCAGAAGATAATT 



2505 



2461 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 

I II M I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I III! I III I I I I 
2506 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 



2520 



2565 



2521 CAC CT GGACAGC C AT CT CAGCTT CT TT GCCT CCAAGCC CAGCC C CACAGCCAT GAT CCT C 2580 



Db 



2566 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CAC CT GGACAGC CAT CT CAGCTT CT TT GCCT CCAAGC C CAGCCC C ACAGC C AT GAT C CT C 2625 



Qy 2581 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2626 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2685 

Qy 2641 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2697 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I.I I I I I I I I I I I I I I I I I I I I 
Db 2686 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2742 
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purified human netrin binding membrane receptor, UNC5H-1. The DNA 
sequence of the invention is useful as a probe for detecting a nucleic 
acid encoding the UNC5H-1 protein in a biological sample. The sequences 
of the invention are useful to screen for agents which decrease the 
activity of the UNC5H-1 protein. The sequences are also useful for 
screening agents which regulate (modulate) the activity of the protein of 
the invention. A pharmaceutical composition containing the protein of the 
invention or a reagent that modulates the activity of the UNC5H-1 protein 
may be useful for treating a UNC5H-1 dysfunction related . disease such as 
cancer or a central nervous system (CNS) disorders (e.g, Parkinson's 
disease, multiple sclerosis, stroke and Alzheimer's disease) . Fusion 
proteins comprising the UNC5H-1 protein are useful for generating 
antibodies and for in various assay systems, and the protein can be used 
as a bait protein in a two-hybrid assay or three-hybrid assay. The method 
of the invention is useful for detecting a coding sequence for the UNC5H- 
1 protein. The present sequence, represents a DNA sequence encoding the 
human netrin binding membrane receptor UNC5H-1 protein of the invention 

Sequence 2697 BP; 503 A; 906 C; 807 G; 481 T; 0 U; 0 Other; 

Query Match 99.6%; Score 2687.4; DB 6; Length 2697; 

Best Local Similarity 99.8%; Pred. No. 0; 

Matches 2691; Conservative 0; Mismatches 6; Indels 0; Gaps 0; 

Qy 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 

Qy 61 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 61 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 120 

Qy 121 GACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATGTGTACATCGTCAAGAACAAGCCA 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 121 GACCTGCTT C CCCACTTCCT GGT GGAGCCC GAGGAT GT GT ACAT CGT CAAGAACAAGCCA 180 

Qy 181 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I 
Db 181 GT GCTGCTT GTGT GCAAGGCCGT GC C C GCCAC GC AGAT CTT CTT CAAGT GCAAC GGGGAG 240 

Qy 241 T GGGTGCGC CAGGTGGACCACGT GAT CGAGCGC AGCACAGACGGGAGCAGT GGGCT GC C C 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 T GGGTGC GCCAGGT GGAC CACGT GAT C GAGCGCAGCACAGACGG GAGCAGT GGGCT GCCC 300 

Qy 301 ACCAT GGAGGTCC GC ATTAATGT CT CAAGGC AGC AGGT CGAGAAGGT GTT C GGGCT GGAG 360 

II I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 ACCATGGAGGT CC GC ATTAATGT CT CAAGGC AGC AGGT CGAGAAGGT GTT C GGGCT GGAG 360 

Qy 361 GAAT ACT GGT GC CAGT GCGTGGCAT GGAGCT C CT CGGGCAC CACCAAGAGT CAGAAGGC C 420 

I I I I I I I I I I I J I I I I I I I II I I I I I I I I I I I I H I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 GAAT ACTGGT GCCAGT GCGT GGCAT GGAGCT CCT CGGGCAC CACCAAGAGT CAGAAGGC C 420 

Qy 421 T ACATCC GCATAGCCAGATT GCGCAAGAACTT C GAGC AGGAGCCGCT GGCCAAGGAGGT G 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 TACATCCGCATAGCCTATTTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTG 480 

Qy 481 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 540 



CC 
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1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ll 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

481 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 540 

541 GT GGAGT GGCT C C GGAACGAGGACCT GGTGGAC C C GT C C CT GGACC C CAAT GT AT AC AT C 600 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 GT GGAGT GGCT CCGGAAC GAGGACCT GGTG GAC CC GT C C CT GGACC CCAAT GT AT ACAT C 600 

601 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 660 

I I I I I II I I I I I I I I I I II I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I II 

601 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 660 

661 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 720 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
661 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 720 

721 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 7 80 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
721 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 780 

781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 840 

841 T GT GAGGGGC AGAAT GT C CAGAAAAC AGCCT GC GC CAC CCT GT GC C C AGT AGAC GGCAGC 900 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
841 T GTGAGGGGCAGAAT GT C CAGAAAACAGCCT GC GC CAC CCT GT GCC CAGT GGAC GGCAGC 900 

901 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

901 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 960 

961 GAGT GCTCT GACCCAGCACCCCGCAACGGAGGGGAGGAGT GCC AGGGCACT GAC CT GGAC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
961 GAGT GCT CT GACCCAGCACCCCGCAAC GGAGGGGAGGAGT GCCAGGGC ACT GAC CT GGAC 1020 

1021 ACCCGCAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCC 1080 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 AC CCGCAACT GT ACCAGT GACCT CT GT GT ACACACT GCTT CTGGCC CT GAGGACGT GGCC 1080 

1081 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1140 

1141 CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 1200 

1201 ACCT CAGGCTT C CAGC CCGT C AGC AT CAAGCCCAGCAAAGCAGACAAC CCC CAT CT GCT C 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 ACCT CAGGCT T C CAGCCCGT CAGC AT CAAGCCC AGCAAAGCAGACAACCCCCAT CT GCT C 



1260 



1261 



ACCAT CCAGC CGGACCT CAGCACCACCACC ACCACCT AC C AGGGCAGT CT CT GT CCCC GG 1320 
I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1261 ACCAT CCAGC CGGACCT CAGCACCACCACCAC C ACCT AC C AGGGCAGT CT CT GT CCC C GG 1320 

1321 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1380 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 1321 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1380 

Qy 1381 GGC GGC CGCCACACACT GCAC C ACAGCT CT C C CAC CT CT GAGGC C GAGGAGT T C GT CT CC 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I 

Db 1381 GGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCC 1440 

Qy 1441 C GCCTCT CCACC CAGAACT ACT T C C GCT C CCT GCC C CGAGGC ACCAGCAAC AT GAC CT AT 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1441 C GCCTCT CCACC CAGAACT ACTT C CGCT C CCT GC CC CGAGGCAC CAGCAACAT GAC CT AT 1500 

Qy 1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I 

Db 1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGAATCAGCCTCCTC 1560 

Qy 1561 ATC CCCCCAGAT GCCAT ACCCC GAGGGAAGAT CT AT GAGAT CTACCT C AC GCT GC ACAAG 1620 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1561 ATC C CCC C AGAT GCCAT ACC C C GAGGGAAGAT CT AT GAGAT CTACCT CAC GCT GCACAAG 1620 

Qy 1621 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1621 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1680 

Qy 1681 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1740 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1681 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 174 0 

Qy 1741 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1800 

I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1741 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1800 

Qy 1801 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I l-l II 1 I I I 

Db 1801 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 18 60 

Qy 1861 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 1861 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1920 

Qy 1921 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 1980 

I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1921 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 1980 

Qy 1981 T CC CT C GAGT ACAACAT CCGGGT CTACT GC CT GCAT GACAC CCAC GAT GC ACT CAAGGAG 2040 

1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 II I 1 1 1 1 1 II 1 1 1 1 I 1 1 li I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 

Db 1981 T CCCT C GAGTACAAC AT CCGGGT CTACT GC CT GCAT GACAC C CAC GAT GC ACT CAAGGAG 2040 

Qy 2041 GTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCAC 2100 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I II I I I I I I II I I I I I I I I I I I I I 

Db 2041 GTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCAC 2100 

Qy 2101 TTCAAGGACAGTTACCACAACCTGCGCCTATC CAT CCAC GAT GTGCCCAGCT CCCT GTGG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2101 TTCAAGGACAGTTACCACAACCT GCGC CT AT C CAT CCAC GAT GT GCCCAGCT CC CT GT GG 2160 

Qy 2161 AAGAGTAAGCTCCTT GT CAGCT ACCAGGAGAT C CCCTTTT AT CACAT CT GGAAT GGCACG 2220 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2161 AAGAGTAAGCTCCTT GT CAGCT ACC AGGAGAT C CC CTTTT AT CACAT CTGGAAT GGCAC G 2220 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



2221 CAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTG 2280 

I I I I I I II I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2221 CAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTG 2280 

2281 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2281 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2340 

2341 AACAT CAC CAAGGACACAAGGTT T GCT GAGCTGCT GGCT CT GGAGAGT GAAGCGGGGGT C 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I II I I I I 
2341 AACAT CAC CAAGGACACAAGGTT T GCT GAGCTGCT GGCT CT GGAGAGT GAAGCGGGGGT C 2400 

2401 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATT 2460 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
2401 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATT 2460 

24 61 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2461 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2520 

2521 CACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTC 2580 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2521 CAC CT GGACAGCCAT CT C AGCT T CTTT GCCT CCAAGCC CAGCC C CAC AGC C AT GAT C CT C 2580 

2581 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 264 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
2581 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCT CAGCC AGCT GGCT GCAGCAGTG 2640 

2641 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2697 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I 
2641 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2697 
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ABK49422 standard; DNA; 2881 BP. 
ABK49422; 

15-JUL-2002 (first entry) 

DNA encoding human UNC5-like protein NOV1. 

Human; NOVX polypeptide; cardiomyopathy; atherosclerosis; cancer; 
cell signal processing; metabolic pathway modulation; cancerous tissue; 
antibody; diabetes; transgenic animal; UNC5-like protein; NOV1; 
chromosome 13; gene; ds . 



Homo sapiens. 

Key 
CDS 



WO200229038-A2. 



Location/Qualifiers 
87. .2786 
/*tag= a 

/product= "Human UNC5-like protein NOV1" 



XX 

PD ll-APR-2002. 
XX 

PF 04-OCT-2001; 2001WO-US031377 . 
XX 

PR 04-OCT-2000; 2000US-0237862P . 
XX 

PA (CURA-) CURAGEN CORP. 
XX 

PI Herrmann JL, Rastelli L, Shimkets RA; 
XX 

DR WPI; 2002-340104/37. 

DR P-PSDB; AAU79939. 
XX 

PT Novel isolated NOVX polypeptide, and encoded polynucleotide, useful for 

PT treating cardiomyopathy, artherosclerosis , and cancer. 

XX 

PS Claim 8; Page 7-8; 180pp; English. 
XX 

CC The present invention relates to a new NOVX polypeptide having a 900 

CC (NOV1), 4349 (NOV2) , 940 (NOV3) , 798 (NOV4), 865 (NOV5) , or 331 (NOV6) 

CC residue amino acid sequence, as given in the specification. The novel 

CC polypeptide, and its encoding polynucleotide, are used to treat 

CC cardiomyopathy, atherosclerosis, cancer or a disease related to cell 

CC signal processing and metabolic pathway modulation, in a human. Detecting 

CC the polypeptide or polynucleotide is useful for identifying cancerous 

CC tissue. The antibody can be used to treat diabetes or cancer. The host 

CC cells can be used to produce non-human transgenic animals useful in drug 

CC screening. The present nucleic acid sequence is that of the human UNC5- 

CC like NOV1 gene located on chromosome 13. This sequence encodes the human 

CC UNC5-like protein NOV1 of the invention 

XX 

SQ Sequence 2881 BP; 526 A; 985 C; 868 G; 502 T; 0 U; 0 Other; 

Query Match 97.2%; Score 2621.4; DB 6; Length 2881; 
Best Local Similarity 98.9%; Pred. No. 0; 

Matches 2673; Conservative 0; Mismatches 21; Indels 9; Gaps 3; 



Qy 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I 
Db 87 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 14 6 



Qy 61 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 120 

I I I I I I I II I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 147 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 206 

« 

Qy 121 GACCT GCTT CCC CACTT C CT GGT GGAGC C C GAGGAT GT GT AC AT CGT CAAGAACAAGC C A 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 207 GACCT GCTT CCC CACTT CCT GGT GGAGC C C GAGGAT GT GT ACAT CGT CAAGAACAAGC C A 266 



Qy 181 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 267 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 326 

Qy 241 T GGGT GCGC CAGGT GGACCACGT GATCGAGCGCAGCACAGACGGGAGCAGT GGGCTGCCC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I III 
Db 327 T GGGT GCGC CAGGT GGACCACGT GATCGAGCGCAGCACAGACGGGAGCAGT GGT GAGCCG 386 



301 ACCATGGAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAG 360 

1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
387 ACCAT GGAGGT CCGCATTAAT GT CTCAAGGC AGCAGGT CGAGAAGGTGTT CGGGCT GGAG 44 6 

361 GAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCC 420 

I I I I I I I I I II I I I I I I II I I I I I I II I I I I I I I I I II I I I I I I I I I II I I II I I I I I I I 
447 GAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCC 506 

421 T ACAT C CGCATAGC CAGAT T GC GCAAGAACT T C GAGCAGGAGCCGCT GGCCAAGGAGGT G 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
507 T ACAT C CGCATAGC CAGATT GC GCAAGAACT T C GAGCAGGAGCCGCT GGCCAAGGAGGT G 566 

481 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
567 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 626 

541 GTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATC 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
627 GT GGAGTGGCT CC GGAACGAGGAC CT GGT GGACCC GT CCCTGGACCCCAAT GT AT ACAT C 686 

601 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 660 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I 
687 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 746 

661 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 720 

I I I I I I I I I I I I I I I 1 .1 I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
747 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 806 

721 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
807 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 866 

781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 840 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
867 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 926 

841 TGT GAGGGGCAGAAT GT CC AGAA AACAGCCTGCGCCACCCTGTGCCCAGTAGACGGC 897 

I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I 

927 TGTGAGGGGCAGAATGTCCATGACCGCACCGTCTCCTCTCTGCTTGTCTCTGTGGACGGC 986 

898 AGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGC 957 

I I I I I I I I I I I I M I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
987 AGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGC 1046 

958 CGTGAGTGCT CT GAC CCAGC ACCCCGCAAC GGAGGGGAGGAGT GCCAGGGCACT GAC CTG 1017 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1047 CGT GAGTGCTCT GAC CCAGCAC CC C GCAAC GGAGGGGAGGAGT GCCAGGGCACT GAC CT G 1106 

1018 GACAC C CGCAACTGT ACCAGT GACCT CT GT GTACACAGT GCTT CT GGCCCT GAGGAC GT G 1077 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I U I I I I I I I 
1107 GACACCCGCAACTGT ACCAGT GACCT CT GT GTACACAGT GCTT CT GGC C CT GAGGAC GT G 1166 

1078 GCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTC 1137 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1167 GCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTC 1226 



Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



1138 ATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATT 1197 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1227 ATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATT 1286 

1198 CT CAC CTC AGGCTT C CAGC CC GT C AGCAT CAAGC C C AGCAAAGCAGACAAC C CCCAT CT G 1257 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1287 CT CACCT CAGGCTT C CAGC C C GT CAGC AT CAAGC C C AGCAAAGCAGACAAC C CC C AT CT G 1346 

1258 CTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCC 1317 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1347 CTCACCAT CCAGCCGGACCT CAG CACCACCACCACCTACCAGGGCAGTCTCTGTCCC 1403 

1318 CGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTG 1377 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1404 CGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTG 1463 

1378 GGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTC 1437 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
14 64 GGT GGC GGC CGC C ACACACT GCAC C ACAGCT CT C CC ACCT CT GAGGCCGAGGAGTT CGT C 1523 

1438 TCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACC 1497 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1524 TCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACC 1583 

1498 TATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTC 1557 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1584 TATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTC 1643 

1558 CT CAT CCC CCCAGATGCCAT AC C CC GAGGGAAGATCT AT GAGATCT ACCT CACGCT GCAC 1617 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1644 CT CAT C CCCCCAGAT GCCAT ACC C C GAGGGAAGATCT AT GAGATCT ACCT CACGCT GCAC 1703 

1618 AAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTT 1677 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1704 AAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTT 1763 

1678 AGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGT 1737 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1764 AGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGT 1823 

1738 GGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGC 1797 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1824 GGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGC 1883 

1798 TGGG AGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAG 1854 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1884 TGGGAGCAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAG 1943 

1855 CTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGA 1914 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1944 CTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGA 2003 

1915 GAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCC 1974 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II 1 1 ! 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1. 1 1 1 1 I I 

2004 GAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCC 2063 
1975 TGCACCTC C CT CGAGT ACAACAT C C GGGT CT ACT GCCT GCAT GAC AC CCAC GAT GC ACT C 2034 



1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 

Db 2064 TGCACCT C CCTCGAGTACAACAT C C GGGTCT ACT GC CT GCAT GACAC C CAC GAT GC ACT C 2123 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



2035 AAGGAGGT GGT GCAGCT GGAGAAGC AGCTGGGGGGAC AGCT GAT C CAGGAG CCACGGGT C 2094 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2124 AAGGAGGT GGT GCAGCT GGAGAAGC AGCTGGGGGGAC AGCT GAT C CAGGAGCC AC GGGT C 2183 

2095 CT GC ACT T CAAGGACAGT T ACCACAACCTGCGC CT AT C CAT CC AC GAT GT GCC C AGCT C C 2154 

I I I I I I I I I I I I I I I I I I Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2184 CT GCACT T CAAGGACAGTT ACCACAACCTGCGC CT AT C C AT CC AC GAT GT GCC C AGCT C C 2243 

2155 CT GT GGAAGAGTAAGCT CCTT GT CAGCT AC CAGGAGAT CC C CTTTT AT C AC AT CT GGAAT 2214 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CT GT GGAAGAGTAAGCT CCTT GT CAGCT AC CAGGAGAT CC CCTTT TAT CAC AT CT GGAAT 2303 



2244 



2215 GGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2304 GGCACGCAGC GGT ACTT GCACT GCACCTTCACCCT GGAGC GT GT CAGCCC C AGC ACT AGT 



2275 



2364 



2335 



GACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I II I I I I 
GACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATC 



2274 



2363 



2334 



2423 



2394 



AACT T CAACAT CACCAAGGAC ACAAGGTTT GCT GAGCT GCT GGCT CT GGAGAGT GAAGC G 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2424 AACTT CAACAT CACCAAGGACACAAGGTTT GCT GAGCT GCTGGCT CT GGAGAGTGAAGCG 24 83 



2395 GGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2484 GGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAG 



2454 



2543 



2514 



2455 ATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAG 
I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAG 2603 



2544 



2515 



2574 



AAACT CCAC CT GGACAGCCATCT CAGCTTCTTT GC CT C CAAGC C CAGC CC C ACAGC CAT G 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2604 AAACT CCACCT GGAC AGC CAT CT CAGCTTCTT T GCCT CCAAGC C CAGC CC C ACAGC CAT G 2663 

2575 ATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCA 2634 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2664 ATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCA 2723 

2635 GCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGC 2694 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
2724 GCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGC 2783 

2695 TGA 2697 
III 

2784 TGA 2786 



RESULT 5 
ADH71609 

ID ADH71609 standard; DNA; 2881 BP. 
XX 

AC ADH71609; 



XX 

DT 25-MAR-2004 (first entry) 
XX 

DE Human gene of the invention N0V21a SEQ ID NO: 505. 
XX 

KW ds; gene; human; cytostatic; immunomodulator ; neuroprotective; nootropic; 

KW anorectic; antidiabetic; antimicrobial; antilipaemic; gene therapy; 

KW vaccine; cancer; cachexia; Alzheimer's disease; Parkinson's disease; 

KW obesity; diabetes; infectious disease; metabolic syndrome X; 

KW dyslipidaemia. 

XX 

OS Homo sapiens. 
XX 

PN WO2003102155-A2. 
XX 

PD ll-DEC-2003. 
XX 

PF 03-JUN-2003; 2003WO-US017430 . 
XX 
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New NOVX polypeptides and nucleic acid molecules useful for preventing or 
treating NOVX-associated disorders, e.g. cancer, diabetes, infection or 
obesity, and in chromosome mapping, tissue typing or pharmacogenomics . 



PS Example 21; SEQ ID NO 505; 1880pp; English. 
XX 

CC The invention relates to a novel isolated polypeptide (NOVX) . A 

CC polypeptide of the invention has cytostatic, immunomodulatory 

CC neuroprotective, nootropic, anorectic, antidiabetic, antimicrobial, and 

CC antilipaemic activity, and may have a use in gene therapy, and as a 

CC vaccine. The polypeptides are encoded by NOVX polynucleotides comprising 

CC any of the 303 fully defined nucleotide sequences given in the 

CC specification. The polypeptide is useful in the manufacture of a 

CC medicament for treating a syndrome associated with a human disease. The 

CC polypeptide, polynucleotide and antibody are useful in diagnosing, 

CC treating or preventing NOVX-associated disorders, e.g. cancer, cachexia, 

CC Alzheimer's disease, Parkinson's disease, obesity, diabetes, infectious 

CC diseases, metabolic syndrome X or dyslipidaemias . The nucleic acids are 

CC further used as hybridisation probes, in chromosome mapping, tissue 

CC typing, preventive medicine, and pharmacogenomics . The present sequence 

CC encodes a NOVX polypeptide of the invention. 

XX 

SQ Sequence 2881 BP; 526 A; 985 C; 868 G; 502 T; 0 U; 0 Other; 

Query Match 97.2%; Score 2621.4; DB 12; Length 2881; 

Best Local Similarity 98.9%; Pred. No. 0; 

Matches 2673; Conservative 0; Mismatches 21; Indels 9; Gaps 3; 

Qy 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 87 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 146 

Qy 61 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 147 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 206 

Qy 121 GAC CT GCTTC CCCACTT C CT GGT GGAGCCC GAGGAT GT GTACAT CGT CAAGAACAAGCCA 180 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 207 GAC CT GCTTC C CCACTT C CT GGT GGAGC CC GAGGAT GT GTACAT CGT CAAGAACAAGCCA 266 

Qy 181 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 240 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 267 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 326 

Qy 241 TGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGGCTGCCC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I III 
Db 327 TGGGTGCGCCAGGT GGACCAC GT GAT CGAGCGCAGC ACAGACGGGAGCAGT GGT GAGCCG 386 

Qy 301 ACCATGGAGGT C CGCAT TAAT GTCT CAAGGCAGC AGGT C GAGAAGGT GTT C GGGCT GGAG 360 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 387 AC CAT GGAGGT CCGCATTAAT GTCT CAAGGCAGCAGGT C GAGAAGGT GTT C GGGCT GGAG 446 

Qy 361 GAAT ACT GGT GC CAGT GCGT GGCAT GGAGCT CCT CGGGC AC CAC CAAGAGT CAGAAGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I 
Db 447 GAAT ACT GGT GCCAGT GCGT GGCAT GGAGCT CCT C GGGC AC CAC CAAGAGT CAGAAGGC C 506 



Qy 

Db 



421 
507 



T AC AT CC GCAT AGC C AGATT GCGCAAGAACTTCGAGCAGGAGC C GCT GGC CAAGGAGGT G 480 
I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II 
TACAT CCGC AT AGCCAGATT GCGCAAGAACT TCGAGCAGGAGC CGCT GGC CAAGGAGGT G 566 



Qy 481 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I 
Db 567 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 626 

Qy 541 GT GGAGT GGCT C C GGAACGAGGAC CT GGT GGAC C C GT C CCT GGAC C C CAAT GT AT AC AT C 600 

I I I II I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 627 GT GGAGT GGCT C C GGAACGAGGAC CT GGT GGAC C C GT CCCT GGAC C C CAAT GTAT ACAT C 686 

Qy 601 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 687 AC GC GGGAGC ACAGCCT GGTGGT GCGACAGGCCC GC CT T GCTGACAC GG CCAACT ACAC C 74 6 

Qy 661 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 720 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I 
Db 747 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 806 

Qy 721 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 807 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 866 

Qy 781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 84 0 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 867 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 926 

Qy 841 T GT GAGGG GC AGAAT GT C C AGAA AACAGCCTGCGCCACCCTGTGCCCAGTAGACGGC 897 

I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I 

Db 927 TGTGAGGGGCAGAATGTCCATGACCGCACCGTCTCCTCTCTGCTTGTCTCTGTGGACGGC 986 

Qy 898 AGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGC 957 

I I I I I I I I I I I I I I I I II I I I I I I I U I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 987 AGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGC 1046 

Qy 958 CGT GAGT GCT CT GAC C CAGCAC C C C GCAAC GGAGGGGAGGAGT GCC AGGGCACT GAC CT G 1017 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I J I I I I I I I I I I 
Db 1047 CGT GAGT GCT CT GACCCAGCAC C CCGCAACGGAGGGGAGGAGT GCCAGGGCACT GAC CT G 1106 

Qy 1018 GACAC CCGCAACT GT ACCAGT GAC CT CT GT GT ACAC AGT GCTT CT GGCC CT GAGGACGT G 1077 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1107 GACAC C C GCAACT GT ACCAGT GACCT CT GT GT ACAC AGT GCTT CT GGCC CT GAGGACGT G 1166 

Qy 1078 GCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTC 1137 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1167 GCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTC 1226 

Qy 1138 ATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATT 1197 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1227 AT CCT CGT TT ATT GCC GGAAGAAGGAGGGGCT GGACT C AGATGT GGCT GACT CGT CCATT 1286 

Qy 1198 CT CACCT CAGGCTTCCAGCCCGT CAGCAT CAAGCCC AGCAAAGCAGACAACCCC CAT CT G 1257 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1287 CT CAC CT CAGGCTT C CAGC CC GT CAGCAT CAAGC C C AGCAAAGCAGACAAC CCC CAT CT G 1346 

Qy 1258 CTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCC 1317 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1347 CT CAC CAT CC AGCC GGAC CT C AG CAC CAC CAC C AC CT ACCAGGGCAGT CT CT GT CC C 1403 

Qy 1318 CGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTG 1377 



Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 



I I 1 1 I 1 1 I I II 1 1 1 1 I I I 1 1 1 1 1 1 1 1 1 1 1 1 l 1 1 1 1 1 1 l I I I 1 1 1 1 I II 1 1 I 1 1 I 1 1 I I 1 1 

1404 CGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTG 1463 



1378 



1437 



GGT GGCGGCCGC CACACACT GCAC CACAGCT CT CC CAC CT CTGAGGCC GAGGAGTT C GT C 
. I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
14 64 GGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTC 1523 

1438 TCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACC 1497 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
TCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACC 



1524 



1583 



1557 



1498 TATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1584 TATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTC 1643 

1558 CTCAT CC CCCCAGAT GCCAT ACC C C GAGGGAAGAT CT ATGAGAT CT AC CT C AC GCT GC AC 1617 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1644 CTCAT CC CCCCAGAT GCCAT ACC C C GAGGGAAGAT CT ATGAGAT CT AC CT C ACGCTGC AC 1703 

1618 AAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTT 1677 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1704 AAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTT 1763 

1678 AGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGT 1737 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
1764 AGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGT 1823 

1738 GGGGAGC CCAGC C CT GACAGCT GGAGCCTGC GC CT CAAAAAGC AGT C GT GCGAGGGCAGC 1797 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1824 GGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGC 1883 

1798 TGGG AGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAG 1854 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
1884 TGGGAGCAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAG 1943 

1855 CTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGA 1914 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1944 CTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGA 2003 

1915 GAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCC 1974 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
2004 GAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCC 2063 

1975 T GCACCT C CCT CGAGTACAACAT CCGGGTCT ACT GCCT GCATGACAC CC AC GAT GCACT C 2034 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2064 T GCACCT CCCT CGAGTACAACAT CCGGGTCT ACT GCCT GCAT GACAC C CAC GAT GCACT C 2123 

2035 AAGGAGGT GGTGCAGCT GGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTC 2094 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
2124 AAGGAGGTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTC 2183 

2095 CT GCACTT CAAGGACAGTTACCACAAC CTGCGCCT AT C CAT CC ACGAT GT GCC CAGCT CC 2154 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2184 CT GCACTT CAAGGACAGTT AC CACAACCTGCGCCT AT CCAT CC ACGAT GT GCCCAGCT CC 2243 

2155 CTGT GGAAGAGTAAGCT CCTT GT CAGCT AC CAGGAGAT CC C CT T TT AT CACAT CT GGAAT 2214 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 2244 CT GT GGAAGAGT AAGCT CCTT GT CAGCT ACC AGGAGAT C C CCT T TT AT C AC AT CT GGAAT 2303 

Qy 2215 GGCACGCAGCGGT ACT T GCACTGCACCTT CAC CCT GGAGC GT GT CAGC CC CAGCACT AGT 2274 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 2304 GGCACGCAGC GGT ACT T GCACTGCACCT TCAC C CT GGAGC GT GT CAGCCCCAGCACT AGT 2363 

Qy 2275 GACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATC 2334 

I I I I I I I I I I II I II II I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I 
Db 2364 GACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATC 2423 

Qy 2335 AACTTCAACATCACCAAGGACACAAGGTTTGCTGAGCT GCTGGCTCT GGAGAGTGAAGCG 2394 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I 
Db 2424 AACTTCAACATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCG 2483 

Qy 2395 GGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAG 2454 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2484 GGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAG 2543 

Qy 2455 ATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAG 2514 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2544 ATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAG 2603 

Qy 2515 AAACT CCAC CTGGACAGC C AT CT CAGCTT CTTT GCCT C CAAGCC CAGC C C C ACAGCC AT G 2574 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2604 AAACT CCAC CTGGACAGC CAT CT CAGCTT CTTT GC CT CCAAGC C CAGC C C C ACAGCC AT G 2663 

Qy 2575 ATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCA 2634 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2664 ATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCA 2723 

Qy 2635 GCAGT GGCT GGACT GGGCC AGCCAGAC GCT GGC CT CTT CACAGT GT C GGAGGCT GAGT GC 2694 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2724 GCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGC 2783 

Qy 2695 TGA 2697 

III 

Db 2784 TGA 2786 



RESULT 6 
ADH71633 

ID ADH71633 standard; DNA; 2880 BP. 
XX 

AC ADH71633; 
XX 

DT 25-MAR-2004 (first entry) 
XX 

DE Human gene of the invention NOV21m SEQ ID NO: 529. 
XX 

KW ds; gene; human; cytostatic; immunomodulator ; neuroprotective; nootropic; 

KW anorectic; antidiabetic; antimicrobial; antilipaemic; gene therapy; 

KW vaccine; cancer; cachexia; Alzheimer's disease; Parkinson's disease; 

KW obesity; diabetes; infectious disease; metabolic syndrome X; 

KW dyslipidaemia. 

XX 

OS Homo sapiens . 
XX 
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PR 


01- 
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0423130P. 


PR 


05^ 


-NOV- 


2002, 


; 2002US- 


00423798. 


PR 


05- 


-NOV- 


2002, 


; 2002US- 


0423798P. 


PR 


12- 


-NOV- 


2002, 


; 2002US- 


0425453P. 



XX 

PA (CURA-) CURAGEN CORP. 
XX 



PI Alsobrook JP, Alvarez E, Anderson DW, Boldog FL, Casman SJ; 

PI Catterton E, Chapoval A, Crabtree-Bokor JR, Edinger SR, Ellerman K; 

PI Ettenberg S, Gangolli EA, Gerlach VX f Gorman L, Gunther E, Guo X; 

PI Gusev VY, Herrmann JL f Ji W, Kekuda R, Li L, Liu X, Macdougall JR; 

PI Maclachlan T, Malyankar UM f Mezick AJ, Millet I, Mishra VS; 

PI Padigaru M, Patturajan M, Pena CEA, Peyman JA, Raha D, Rastelli L; 

PI Rieger DK, Rothenberg ME, Sciore P, Shenoy SG, Shimkets RA; 

PI Smithson G, Spytek KA, Stone DJ, Vernet CAM, Voss EZ, Zhong M; 

PI Zhong H; 

XX 

DR WPI; 2004-081935/08. 

DR P-PSDB; ADH71634. 
XX 

PT New NOVX polypeptides and nucleic acid molecules useful for preventing or 

PT treating NOVX-associated disorders, e.g. cancer, diabetes, infection or 

PT obesity, and in chromosome mapping, tissue typing or pharmacogenomics . 
XX 

PS Example 21; SEQ ID NO 529; 188 Opp; English. 
XX 

CC The invention relates to a novel isolated polypeptide (NOVX) . A 

CC polypeptide of the invention has cytostatic, immunomodulator, 

CC neuroprotective, nootropic, anorectic, antidiabetic, antimicrobial, and 

CC antilipaemic activity, and may have a use in gene therapy, and as a 

CC vaccine. The polypeptides are encoded by NOVX polynucleotides comprising 

CC any of the 303 fully defined nucleotide sequences given in the 

CC specification. The polypeptide is useful in the manufacture of a 

CC medicament for treating a syndrome associated with a human disease. The 

CC polypeptide, polynucleotide and antibody are useful in diagnosing, 

CC treating or preventing NOVX-associated disorders, e.g. cancer, cachexia, 



CC Alzheimer's disease, Parkinson's disease, obesity, diabetes, infectious 

CC diseases, metabolic syndrome X or dyslipidaemias . The nucleic acids are 

CC further used as hybridisation probes, in chromosome mapping, tissue 

CC typing, preventive medicine, and pharmacogenomics . The present sequence 

CC encodes a NOVX polypeptide of the invention. 

XX 

SQ Sequence 2880 BP; 527 A; 984 C; 867 G; 502 T; 0 U; 0 Other; 

Query Match 97.1%; Score 2619.8; DB 12; Length 2880; 

Best Local Similarity 98.9%; Pred. No. 0; 

Matches 2672; Conservative 0; Mismatches 22; Indels 9; Gaps 3; 

Qy 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 86 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 145 

Qy 61 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 120 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 146 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 205 

Qy 121 GACCT GCTT CC CCACTT C CT GGT GGAGC C CGAGGAT GT GT ACATC GTCAAGAACAAGC C A 180 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 206 GAC CT GCT T CC CCACTT C CT GGT GGAGC C C GAGGAT GT GT AC AT C GTCAAGAACAAGCCA 265 

Qy 181 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 240 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I 
Db 266 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 325 

Qy 241 TGGGT GCGC CAGGT GGACCAC GT GATCGAGCGC AGCACAGAC GGGAGC AGT GGGCT GCC C 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 326 TGGGT GCGC CAGGT GGACCAC GTGAT C GAGC GC AGCACAGAC GGGAGC AGT GGT GAGCC G 385 

Qy 301 AC CAT GGAGGT CCGCAT TAAT GT CT CAAGGCAGCAGGT C GAGAAGGTGT T C GGGCT GGAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 386 AC CAT GGAGGT CCGCATTAAT GT CT CAAGGCAGCAGGT C GAGAAGGT GT TC GGGCT GGAG 445 

Qy 361 GAATACTGGTGCCAGTGCGT GGCAT GGAGCT C CT CGGGCACCACCAAGAGT C AGAAGGC C 420 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 446 GAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCC 505 

Qy 421 TACAT CCGCAT AGC CAGATT GC GCAAGAACTT C GAG CAGGAGC CGCT GGCCAAGGAGGT G 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 506 TACAT C CGCAT AGC CAGATT GCGCAAGAACTT C GAGC AGGAGC CGCT GGC CAAGGAGGT G 565 

Qy 481 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 540 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i i 

Db 566 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 625 

Qy 541 GTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATC 600 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 626 GTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATC 685 

Qy 601 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 660 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 686 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 745 



Qy 



661 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 720 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



746 



721 



806 



781 



866 



841 



926 



898 



986 



958 



I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I 
TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGGCTCCGCTGCTGTCATCGTCTAC 805 

GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 780 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 865 

GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 925 

T GT GAGGGGCAGAAT GT C CAGAA AAC AGCCT GC GC C AC CCT GT GC C C AGT AGAC GGC 897 

I I I I I I I II I I I II I I I I I I I I I I I I I I II I I I I I I I I I I 

TGTGAGGGGCAGAATGTCCATGACCGCACCGTCTCCTCTCTGCTTGTCTCTGTGGACGGC 985 

AGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGC 957 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I j I I I I I I I I I I I I I I I I 
AGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGC 1045 



CGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTG 1017 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1046 C GT GAGT GCT CT GAC CCAGCACCCCGCAAC GGAGGGGAGGAGTGCC AGGGCACT GAC CT G 1105 

1018 GACACC C GCAACT GT ACC AGTGACCT CT GT GTAC AC AGT GCT TCT GGC C CT GAGGAC GT G 1077 

I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1106 GACACC C GCAACT GTAC CAGT GACCT CT GT GT AC ACAGT GCTTCT GGC C CT GAGGAC GT G 1165 

1078 GCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTC 1137 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTC 



1166 



1225 



1138 ATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATT 1197 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1226 ATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATT 1285 

1198 CTCACCT CAGGCTT C CAGC CCGT CAGC AT CAAGCC CAGCAAAGC AGACAAC C CC CAT CT G 1257 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
1286 CTCACCTCAGGCTTCCAGCCCGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCATCTG 1345 

1258 CTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCC 1317 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1346 CTCACCATCCAGCCGGACCTCAG CACCACCACCACCTACCAGGGCAGTCTCTGTCCC 1402 

1318 CGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTG 1377 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1403 CGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTG 1462 

1378 GGT GGC GGC C GC CACACACT GCACCAC AGCT CT C C CACCT CT GAGGC C GAGGAGTT CGT C 1437 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTC 



1463 



1522 



1438 TCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACC 1497 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACC 



1523 



1582 



1498 TATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTC 1557 
I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1583 TATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTC 1642 

1558 CTCATC CCC CCAGAT GCCAT ACC CCGAGGGAAGAT CT AT GAGAT CTAC CT CAC GCT GCAC 1617 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I 
1643 CT CATCCCC CCAGAT GCCAT ACC C CGAGGGAAGAT CT AT GAGAT CTAC CT CACGCT GCAC 1702 

1618 AAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTT 1677 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1703 AAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTT 1762 

167 8 AGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGT 1737 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGT 



1763 



1822 



1738 GGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGC 1797 

I I I I I I I I I I I I I I I 1.1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
1823 GGGGAGCCCAGCCCTGACAGCTGGAGCCTGCACCTCAAAAAGCAGTCGTGCGAGGGCAGC 1882 

1798 TGGG AGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAG 1854 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1883 TGGGAGCAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAG 1942 

1855 CTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGA 1914 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1943 CTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGA 2002 

1915 GAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCC 1974 

IN I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2003 GAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCC 2062 

1975 TGCACCT CC CTCGAGTACAAC AT C C GGGT CT ACT GC CT GC AT GACAC C CAC GAT GCACT C 2034 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2063 T GCACCT CC CTCGAGTACAAC AT C C GGGTCT ACT GCCT GC AT GACAC C CAC GAT GCACT C 



2122 



2035 AAGGAGGTGGT GCAGCTGGAGAAGCAGCT GGGGGGACAGCT GAT CCAGGAGCCACGGGT C 2094 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2123 AAGGAGGTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCT GAT CCAGGAGCCACGGGT C 2182 

2095 CTGCACT TCAAGGACAGTT ACCACAACCT GCGC CT ATC CAT CCACGAT GT GCC C AGCT C C 2154 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
2183 CTGCACT TCAAGGACAGTT AC CACAACCT GC GC CT AT C CAT CCACGAT GT GC C C AGCT C C 2242 

2155 CTGT GGAAGAGT AAGCTCCTT GT CAGCT AC CAGGAGAT CCC CTTT TAT CAC AT CTGGAAT 2214 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTGTGGAAGAGT AAGCTCCTT GT CAGCT AC CAGGAGAT CCC CTTT TAT CAC AT CT GGAAT 2302 



2243 



2215 



GGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2303 GGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGT 



2275 



2363 



2335 



2423 



GACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATC 

I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I 
GACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATC 



2274 



2362 



2334 



2422 



2394 



AACTTCAAC ATCAC CAAGGACACAAGGTTT GCT GAGCT GCT GGCT CT GGAGAGT GAAGC G 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AACT TCAACATCACC AAGGACACAAGGT TT GCT GAGCT GCT GGCT CT GGAGAGT GAAGCG '2482 



Qy 2395 GGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAG 2454 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2483 GGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAG 2542 

Qy 2455 ATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAG 2514 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 2543 ATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAG 2602 

Qy 2515 AAACT C CAC CT GGACAGC CAT CT CAGCTT CTTT GC CT CCAAGCCC AGC C C C ACAGC C AT G 2574 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 2603 AAACT C CAC CT GGACAGC CAT CT CAGCTT CTTT GCCT CCAAGCCC AGC C CC ACAGC CAT G 2662 

Qy 2575 ATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCA 2634 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2663 ATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCA 2722 

Qy 2635 GCAGT GGCT GGACT GGGCCAGC CAGAC GCT GGC CT CTT CACAGT GT CGGAGGCT GAGT GC 2694 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2723 GCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGC 2782 

Qy 2695 TGA 2697 

I I I 

Db 2783 TGA 2785 



RESULT 7 
ADH71649 

ID ADH71649 standard; DNA; 2881 BP. 
XX 

AC ADH71649; 
XX 

DT 25-MAR-2004 (first entry) 
XX 

DE Human gene of the invention NOV21u SEQ ID NO: 545. 
XX 

KW ds; gene; human; cytostatic; immunomodulator ; neuroprotective; nootropic; 

KW anorectic; antidiabetic; antimicrobial; antilipaemic; gene therapy; 

KW vaccine; cancer; cachexia; Alzheimer's disease; Parkinson f s disease; 

KW obesity; diabetes; infectious disease; metabolic syndrome X; 

KW dyslipidaemia . 

XX 

OS Homo sapiens. 
XX 

PN WO2003102155-A2. 
XX 



PD 


11- 


DEC- 


2003. 






XX 












PF 


03- 


JUN- 


2003; 


2003WO- 


US017430. 


XX 












PR 


03- 


JUN- 


2002; 


2002US- 


0385120P. 


PR 


04- 


JUN- 


•2002; 


2002US- 


0385784P. 


PR 


05- 


JUN- 


2002; 


2002US- 


0386041P. 


PR 


05- 


JUN- 


•2002; 


2002US- 


0386047P. 


PR 


06- 


JUN- 


•2002; 


2002US- 


0386376P. 


PR 


06- 


JUN- 


2002; 


2002US- 


0386453P. 


PR 


06- 


JUN- 


2002; 


2002US- 


0386864P. 



PR 

t x\ 


06 


- JUN- 


■2002; 


PR 

IT fx 


07 


- JUN- 


•2002; 


PR 

XT XX 


07 


- JUN- 


-2002; 


PR 

XT XX 


07 


- JUN- 


-2002 ; 


PR 

IT i\ 


07 


- JUN- 


■2002 ; 


PR 

XT XX 


07 


- JUN- 


•2002 ; 


PR 


07 


- JUN- 


■2002 ; 


PR 

xr r\ 


08 


— iTT IN - 


-2002 ; 


PR 

xr r\ 


10 


- JUN- 


-2002 ; 


PR 

xr r\ 


10 


- JUN- 


•2002 ; 


PR 

xr r\ 


-L J. 


— iTTIM- 


•2009 : 


PR 


1 1 

X J. 


- .TTTM- 

U UiN 


•9009 • 

Z. U U Z, t 


PR 

xr t\ 


1 1 

X X 




-9009 • 


PR 

XT fx 


1 1 

X X 


O UIN 


•9009 • 

Z. \J VJ Z, / 


PR 

i: Xx 


1 1 
X X 


— iTT T7\I— 


9009 • 


PR 

XT Xx 


1 1 

X X 


— .TTIM— 

U UiN 


•9009 • 


PP 


1 T 

X X 


- .TTTrvT- 
U UiN 


•9009 • 

C. V UZ. f 


PR 


1 T 

X X 


u UiN 


•9009 • 

Z. \J VJ Z. / 


PR 

XT fx 


1 9 
X z 


— •TTTN— 

U U IN 


•9009 • 
z u \J z. f 


PR 
fr fx 


1 9 

X z 


-.TTTTvT- 

U UiN 


•9009 • 

Z. U UZ, f 


PR 


X z 


-.TTTrvT- 


•9009 • 

Z> U UZ. / 


PR 


x z 


— ■TTTM— 


•9009 • 

Z VJ VJ Z / 


PR 

fr fx 


1 9 

x z 


— iTTIM— 

U UiN 


•9009 • 

Z U UZ, ^ 


PR 
XT fx 


X o 


-.TTTM- 
U UiN 


9009 • 

Z. U U Z / 


PP 

rrf\ 


1 4 

X *± 


- .TTTM- 


• 9009 • 
z u vj z , 


PP 

trrv 


1 A 


- TTTrvT- 
U UiN 


•9009 • 

Z. U U Z / 


PP 
rrfx 


1 4 
XI 


- .TTTM- 
U UIN 


• 9009 • 


PP 

XT f\ 


X ft 


- .TTTTvT- 
U UiN 


• 9009 • 

Z U UZ /■ 


PP 
trrv 


1 7 


U UiN 


• 9009 • 

Z U UZ , 


PP 

rrf\ 


1 7 
x / 


- .TTTXT- 
u UIN 


• 9009 • 
Z, U UZ, / 


PP 

XT IN 


1 ft 
x o 


- .TTTrVT- 
U UiN 


• 9009 • 

Z. U U Z» / 


PP 


x _? 


-.TTTM- 
U UiN 


• 9009 • 

Z, U UZ, / 


PR 
xr Xx 


1 Q 

X 7 


U UiN 


•9 009 • 

Z U U Z, / 


PR 

fr f\ 


Z X 


- TTTN- 
U UiN 


-9 009* 

Z U U Z / 


PR 
xr f\ 


1 7 

X / 


_ TT T T - 


-9009 • 

Z, U UZ, / 


PR 

fr f\ 


ofi 

U D 




• 9009 • 

Z U UZ / 


PP 


oq 

U _7 


- ATTfU- 


-9009 • 

Z, U UZ, / 


PR 

fr fx 


HQ 

U 37 




•9009 • 

Z, U UZ, / 


PR 

XT IX 


HQ 
u 17 


- ATTft- 


• 9009 • 

Z. U U Z / 


PR 

XT fx 


1 9 
xz, 


_ ATJC- 


-9009 • 


PR 

t fx 


1 9 


- ATTfZ- 


• 9 009 • 

Z U UZ , 


PR 

XT fx 


1 9 




-9 009 • 

Z, U U Z> / 


PR 

XT fx 


1 9 
x z 




-9009 • 

Z U UZ. / 


PR 

IT fx 


X o 


- ATTfl- 


•9009 • 

Z U U Z f 


PR 

IT fx 


1 "3 

X o 


- ATTfl- 


•9009 • 
Z U UZ, r 


PR 

XT fx 


X o 




•9009 • 

Z \J \J Z f 


PR 

xr r\ 


13 


-AUG- 


•2002 ; 


PR 

XT fx 


13 


-AUG- 


•2002 ; 


PR 


13 


-AUG- 


•2002 ; 


PR 


15 


-AUG- 


•2002 ; 


PR 

XT XX 


26 


-AUG- 


•9002 • 

Z. U U Z. / 


PP 


96 

Z. D 




• 9009 • 
Z. U UZ. / 


PR 


27 


-AUG- 


-2002; 


PR 


12 


-SEP- 


•2002; 


PR 


20 


-SEP- 


-2002; 


PR 


23 


-SEP- 


-2002; 


PR 


30 


-SEP- 


•2002; 



2002US-0387016P. 
2002US-0386796P. 
2002US-0386816P. 
2002US-0386931P. 
2002US-0386942P. 
2002US-0386971P. 
2002US-0387262P. 
2002US-0296960P. 
2002US-0387400P. 
2002US-0387535P. 
2002US-0387610P. 
2002US-0387625P. 
2002US-0387634P. 
2002US-0387668P. 
2002US-0387696P. 
2002US-0387702P. 
2002US-0387836P. 
2002US-0387859P. 
2002US-0387933P. 
2002US-0387934P. 
2002US-0387960P. 
2002US-0388022P. 
2002US-0388096P. 
2002US-0389123P. 
2002US-0389118P. 
2002US-0389120P. 
2002US-0389144P. 
2002US-0389146P. 
2002US-0389729P. 
2002US-0389742P. 
2002US-0389884P. 
2002US-0390006P. 
2002US-0390209P. 
2002US-0390763P. 
2002US-0396706P. 
2002US-0401628P. 
2002US-0402156P. 
2002US-04022.56P. 
2002US-0402389P. 
2002US-0402786P. 
2002US-0402816P. 
2002US-0402821P. 
2002US-0402832P. 
2002US-0403448P. 
2002US-0403459P. 
2002US-0403531P. 
2002US-0403532P. 
2002US-0403563P. 
2002US-0406317P. 
2002US-0403617P. 
2002US-0406182P. 
2002US-0406355P. 
2002US-0406240P. 
2002US-0410084P. 
2002US-0412528P. 
2002US-0412731P. 
2002US-0414801P. 



PR 

it r\ 


30 


-SEP- 


•2002; 


2002US- 


0414 839P 


PR 


30 


-SEP- 


-2002; 


2002US- 


0414840P 


PR 


30 


-SEP- 


■2002; 


2002US- 


0414954P 


PR 


09 


-OCT- 


-2002 ; 


2002US- 


0417186P 


PR 

IT i\ 


09 


-OCT- 


•2002 ; 


2002US- 


041 7406P 


PR 


£. -J 


-OCT- 


-2002 ; 




v t c u u j 7 r • 


PR 




-OCT- 


-2002 ; 


£t \J \J £m \J O 


04?1 1 SfiP 


PR 


31 


-OCT- 


■2002; 


2002US- 


0422690P. 


PR 


01- 


-NOV- 


•2002; 


2002US- 


0423130P. 


PR 


05- 


-NOV- 


•2002; 


2002US- 


00423798. 


PR 


05 


-NOV- 


•2002; 


2002US- 


0423798P. 


PR 


12 


-NOV- 


•2002; 


2002US- 


0425453P. 



XX 

PA (CURA-) CURAGEN CORP. 
XX 

PI Alsobrook JP, Alvarez E, Anderson DW, Boldog FL, Casman SJ; 

PI Catterton E, Chapoval A, Crabtree-Bokor JR, Edinger SR, Ellerman K; 

PI Ettenberg S, Gangolli EA, Gerlach VL, Gorman L, Gunther E, Guo X; 

PI Gusev VY, Herrmann JL, Ji W, Kekuda R, Li L, Liu X, Macdougall JR; 

PI Maclachlan T, Malyankar UM, Mezick AJ,. Millet I, Mishra VS; 

PI Padigaru M, Patturajan M, Pena CEA, Peyman JA, Raha D, Rastelli L; 

PI Rieger DK, Rothenberg ME, Sciore P, Shenoy SG, Shimkets RA; 

PI Smithson G, Spytek KA, Stone DJ, Vernet CAM, Voss EZ, Zhong M; 

PI Zhong H; 

XX 

DR WPI; 2004-081935/08. 

DR P-PSDB; ADH71650. 
XX 

PT New NOVX polypeptides and nucleic acid molecules useful for preventing or 

PT treating NOVX-associated disorders, e.g. cancer, diabetes, infection or 

PT obesity, and in chromosome mapping, tissue typing or pharmacogenomics . 
XX 

PS Example 21; SEQ ID NO 545; 1880pp; English. 
XX 

CC The invention relates to a novel isolated polypeptide (NOVX) . A 

CC polypeptide of the invention has cytostatic, immunomodulator, 

CC neuroprotective, nootropic, anorectic, antidiabetic, antimicrobial, and 

CC antilipaemic activity, and may have a use in gene therapy, and as a 

CC v vaccine. The polypeptides are encoded by NOVX polynucleotides comprising 

CC any of the 303 fully defined nucleotide sequences given in the 

CC specification. The polypeptide is useful in the manufacture of a 

CC medicament for treating a syndrome associated with a human disease. The 

CC polypeptide, polynucleotide and antibody are useful in diagnosing, 

CC treating or preventing NOVX-associated disorders, e.g. cancer, cachexia, 

CC Alzheimer's disease, Parkinson's disease, obesity, diabetes, infectious 

CC diseases, metabolic syndrome X or dyslipidaemias . The nucleic acids are 

CC further used as hybridisation probes, in chromosome mapping, tissue 

CC typing, preventive medicine, and pharmacogenomics. The present sequence 

CC encodes a NOVX polypeptide of the invention. 

XX 

SQ Sequence 2881 BP; 526 A; 986 C; 868 G; 501 T; 0 U; 0 Others- 
Query Match 97.1%; Score 2619.8; DB 12; Length 2881; 
Best Local Similarity 98.9%; Pred. No. 0; 

Matches 2672; Conservative 0; Mismatches 22; Indels 9; Gaps 3; 
Qy 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 



1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

87 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 146 

61 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I II I I I I I I I 

147 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 206 

121 GACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATGTGTACATCGTCAAGAACAAGCCA 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
207 GAC CTGCTT C C CCACTT C CT GGT GGAGC CC GAGGAT GT GTAC AT C GT CAAGAACAAGC CA 266 

181 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
267 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 326 

241 TGGGT GCGC C AGGT GGACCACGT GATC GAGC GCAGCACAGAC GGGAGC AGT GGGCT GCCC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
327 TGGGTGCGCC AGGT GGACCAC GT GATC GAGC GCAGCACAGACGGGAGC AGT GGT GAGCCG 386 

301 ACCATGGAGGT CCGCATTAAT GT CT CAAGGC AGCAGGT CGAGAAGGT GT T CGGGCT GGAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
387 ACCATGGAGGT CCGCATTAAT GT CT CAAGGC AGCAGGT C GAGAAGGT GT T CGGGCT GGAG 446 

361 GAAT ACT GGT GCCAGT GCGT GGCAT GGAGCT C CT C GGGCACCAC CAAGAGT CAGAAGGCC 420 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
447 GAAT ACT GGT GCCAGT GC GT GGCAT GGAGCT C CT C GGGCACCAC CAAGAGT CAGAAGGCC 506 

421 TACAT CC GCAT AGC CAGATT GCGCAAGAACTT CGAGCAGGAGCCGCT GGCCAAGGAGGT G 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
507 TACATCC GCAT AGCCAGATT GCGCAAGAACTT CGAGCAGGAGCC GCTGGCCAAGGAGGT G 566 

481 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
567 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 626 

541 GT GGAGT GGCT CCGGAAC GAGGACCT GGT GGACCC GT C C CT GGAC C CCAAT GTAT ACAT C 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
627 GT GGAGT GGCT CCGGAAC GAGGACCTGGT GGACCC GT C C CT GGAC C CCAAT GTAT ACAT C 686 

601 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
687 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 746 

661 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
747 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 806 

721 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 780 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
807 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 866 

781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
867 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 926 



841 T GT GAGGGGC AGAATGT CCAGAA AACAGCCTGCGCCACCCTGTGCCCAGTAGACGGC 897 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 
Qy 

Db 



927 TGTGAGGGGCAGAATGTCCATGACCGCACCGTCTCCTCTCTGCTTGTCTCTGTGGACGGC 986 



898 



987 



958 



AGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGC 957 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
AGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGC 104 6 



CGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTG 1017 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
1047 CGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTG 1106 

1018 GACACCC GCAACT GT ACCAGT GAC CT CT GT GT AC AC AGTGCTT CT GGC C CT GAGGACGTG 1077 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1107 GACACCCGCAACT GT AC CAGT GAC CT CT GT GTACAC AGTGCTT CTGGC CCT GAGGACGT G 1166 

1078 GCCCTCTATG.TGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTC 1137 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
1167 GCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTC 1226 

1138 ATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATT 1197 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1227 ATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATT 1286 



1198 CT CAC CT CAGGCTT C CAGCC C GT CAGCAT CAAGCC CAGCAAAGCAGACAAC CCCC AT CT G 1257 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1287 CT CACCT CAGGCTT CCAGCC C GT CAGCAT CAAGCC CAGCAAAGCAGACAAC CCCC AT CT G 1346 

1258 CTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCC 1317 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

1347 CTCAC CAT CCAGCC GGACCT CAG CACCACCACCACCTACCAGGGCAGTCTCTGTCCC 14 03 

1318 CGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTG 1377 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

1404 CGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTG 1463 

1378 GGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTC 1437 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1464 GGT GGCGGCCGCCACACACT GCACCACAGCT CT C CCACCT CTGAGGC CGAGGAGT T CGT C 1523 

1438 TCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACC 14 97 

I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

1524 TCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGC7\ACATGACC 1583 

14 98 TATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTC 1557 

I I I I I I I I I I I I I I I I I I M I I I I I M I I I I I 1 I I I I I I I I I I II I I I I I I I I I I I I I II 

1584 TATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTC 1643 

1558 CT CAT CC C CC CAGAT GCCAT ACC CCGAGGGAAGAT CT ATGAGAT CTAC CT CAC GCT GC AC 1617 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1644 CT C AT CCC CC CAGAT GCCAT ACCCC GAGGGAAGAT CT ATGAGAT CTAC CT CACGCT GCAC 1703 

1618 AAGCCGGAAGAC GT GAGGTT GC CCCT AGCT GGCT GT C AGAC CCT GCT GAGT C CCAT C GT T 1677 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1704 AAGCCGGAAGAC GT GAGGTT GC CC CT AGCT G GCT GT C AGAC CCT GCT GAGT CCCAT C GT T 1763 

1678 AGCT GTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCT GGCT AT GGACCACTGT 1737 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1764 AGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGT 1823 



Qy 1738 GGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGC 1797 

I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1824 GGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGC 1883 

Qy 1798 TGGG AGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAG 1854 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1884 TGGGAGCAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAG 194-3 

Qy 1855 CTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGA 1914 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1944 CTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGA 2003 

Qy 1915 GAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCC 1974 

I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2004 GAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCC 2063 

Qy 1975 T GCACCT CCCTCGAGT ACAACAT CC GGGT CTACT GC CT GCAT GACAC C CAC GAT GCACT C 2034 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2064 T GCACCT CCCTCGAGT ACAACAT C C GGGT CTACT GC CT GCAT GACAC C CAC GAT GCACT C 2123 

Qy 2035 AAGGAGGTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTC 2094 

I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2124 AAGGAGGT GGTGCAGCT GGAGAAGCAGCT GGGGGGACAGCT GAT C CAGGAGC CAC GGGT C 2183 

Qy 2095 CTGCACTTCAAGGACAGTT ACCACAAC CT GCGCCTATC CAT C CAC GAT GT GC C CAGCT C C 2154 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2184 CTGCACTTCAAGGACAGTT AC CACAACCTGCGCCTATC CAT CCAC GAT GT GCC CAGCT CC 2243 

Qy 2155 CTGTGGAAGAGTAAGCTCCTT GT CAGCT AC CAGGAGAT CC C CTT TTAT CACATCTGGAAT 2214 

I I I I I I I I I I I I II I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2244 CTGT GGAAGAGTAAGCT CCTT GT CAGCT AC CAGGAGAT C CC CTT TTAT CAC AT CTGGAAT 2303 

Qy 2215 GGCACGCAGC GGTACTT GCACT GCAC CTT CAC C CT G GAGCGT GT CAGC CC CAGCACT AGT 2274 

1 1 1 n 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 2304 GGCACGCAGC GGTACTT GCACT GCACCTT CAC C CT GGAGCGT GT CAGCC C CAGCACT AGT 2363 

Qy 2275 GACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATC 2334 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2364 GACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATC 2423 

Qy 2335 AACT TCAACATCACCAAGGACACAAGGT TT GCT GAGCT GCT GGCT CT GGAGAGT GAAGCG 2394 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I l -l I I I I I I I I I I I I I I I I 
Db 2424 AACTTCAACATCACCAAGGACACAAGGTTTGCTGAGCT GCT GGCT CT GGAGAGT GAAGCG 2483 

Qy 2395 GGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAG 2454 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
• Db 2484 GGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAG 2543 

Qy 2455 ATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAG 2514 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2544 ATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAG 2603 

Qy 2515 AAACTC CACCTGGACAGCCATCT CAGCTT CT TT GC CT C CAAGCCCAGCCCC ACAGC CAT G 2574 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2604 AAACTC CACCTGGACAGC CAT CT CAGCTT CTT T GC CT C CAAGCCCAGCCC C ACAGC CAT G 2663 



Qy 

Db 



2575 
2664 



ATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCA 2634 
I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I i I I I I I 
ATCCTCAACCTGCGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCA 2723 



Qy 2635 GCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGC 2694 

I I I I I I I I I I I I I I I I I I II II II I I I I I I I I I I I I I I I I I I I II II I I II I I I I I I I I I 
Db 2724 GCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGC 2783 

Qy 2695 TGA 2697 

III . 
Db 2784 TGA 2786 



RESULT 8 
ADH71635 

ID ADH71635 standard; DNA; 2881 BP. 
XX 

AC ADH71635; 
XX 

DT 25-MAR-2004 (first entry) 
XX 

DE Human gene of the invention N0V21n SEQ ID NO: 531. 
XX 

KW ds; gene; human; cytostatic; immunomodulator ; neuroprotective; nootropic; 

KW anorectic; antidiabetic; antimicrobial; antilipaemic; gene therapy; 

KW vaccine; cancer; cachexia; Alzheimer's disease; Parkinson's disease; 

KW obesity; diabetes; infectious disease; metabolic syndrome .X; 

KW dyslipidaemia. 

XX 

OS Homo sapiens. 
XX 

PN WO2003102155-A2. 
XX 
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PI Alsobrook JP, Alvarez E, Anderson DW, Boldog FL, Casman SJ; 

PI Catterton E, Chapoval A, Crabtree-Bokor JR, Edinger SR, Ellerman K; 

PI Ettenberg S, Gangolli EA, Gerlach VL, Gorman L, Gunther E, Guo X; 

PI Gusev VY, Herrmann JL, Ji W, Kekuda R, Li L, Liu X, Macdougall JR; 

PI Maclachlan T, Malyankar UM, Mezick AJ, Millet I, Mishra VS; 

PI Padigaru M, Patturajan M, Pena CEA, Peyman JA, Raha D, Rastelli L; 

PI Rieger DK, Rothenberg ME, Sciore P, Shenoy SG, Shimkets RA; 

PI Smithson G, Spytek KA, Stone DJ, Vernet CAM, Voss EZ, Zhong M; 

PI Zhong H; 

XX 

DR WPI; 2004-081935/08. 

DR P-PSDB; ADH71636. 
XX 

PT New NOVX polypeptides and nucleic acid molecules useful for preventing or 

PT treating NOVX-associated disorders, e.g. cancer, diabetes, infection or 

PT obesity, and in chromosome mapping, tissue typing or pharmacogenomics . 
XX 

PS Example 21; SEQ ID NO 531; 1880pp; English. 
XX 

CC The invention relates to a novel isolated polypeptide (NOVX) . A 

CC polypeptide of the invention has cytostatic, immunomodulator, 



CC neuroprotective, nootropic, anorectic, antidiabetic, antimicrobial, and 

CC antilipaemic activity, and may have a use in gene therapy, and as a 

CC vaccine. The polypeptides are encoded by NOVX polynucleotides comprising 

CC any of the 303 fully defined nucleotide sequences given in the 

CC specification. The polypeptide is useful in the manufacture of a 

CC medicament for treating a syndrome associated with a human disease. The 

CC polypeptide, polynucleotide and antibody are useful in diagnosing, 

CC treating or preventing NOVX-associated disorders, e.g. cancer, cachexia, 

CC Alzheimer's disease, Parkinson's disease, obesity, diabetes, infectious 

CC diseases, metabolic syndrome X or dyslipidaemias . The nucleic acids are 

CC further used as hybridisation probes, in chromosome mapping, tissue 

CC typing, preventive medicine, and pharmacogenomics. The present sequence 

CC encodes a NOVX polypeptide of the invention. 

XX 

SQ Sequence 2881 BP; 527 A; 985 C; 867 G; 502 T; 0 U; 0 Other; 



Query Match 97.1%; Score 2619.8; DB 12; Length 2881; 

Best Local Similarity 98.9%; Pred. No. 0; 

Matches 267.2; Conservative 0; Mismatches 22; Indels 9; Gaps 3; 

Qy 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 87 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 146 

Qy 61 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 120 

I I I I II I I I I I I I I I I I I I II I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 147 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 206 

Qy 121 GACCTGCTT C CCCACTTC CT GGT GGAGC C C GAGGAT GT GTACAT C GT CAAGAACAAGC CA 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I II I I I I I I II I I I I I II I I I I I II I I I 
Db 207 GACCTGCTT CCCCACT TCCT GGT GGAGC C C GAGGAT GT GTACAT C GT CAAGAACAAGCCA 266 



Qy 



181 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



240 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



267 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 326 



241 



327 



301 



387 



361 



447 



421 



507 



481 



567 



541 



627 



601 



687 



661 



747 



721 



807 



781 



867 



841 



927 



898 



987 



958 



TGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGGCTGCCC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
T GGGT GCGC CAGGT GGAC C ACGT GAT C GAGC GC AGC ACAGACGGGAGCAGT GGT GAGC C G 

AC CAT GGAGGT C C GC ATTAAT GT CT CAAGGC AGC AGGT CGAGAAGGT GTT CGGGCT GGAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
AC CAT GGAGGT C C GC ATTAAT GT CT CAAGGCAGCAGGT C GAGAAGGT GTT C GGGCT GGAG 

GAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCC 

I I I I I I I II II I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCC 

T AC AT CC GCAT AGC CAGATT GC GCAAGAACTT C GAGC AGGAGC CGCT GGC CAAGGAGGT G 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TACAT CC GCAT AGC CAGATT GC GCAAGAACTT C GAGC AGGAGCC GCT GGC CAAGGAGGT G 

TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 

GT GGAGT GGCT CC GGAACGAGGAC CT GGTGGACC C GT C CCT GGACC C CAAT GT AT AC AT C 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I U I I I I I I I I I I I I I I I I I 

GT GGAGT GGCT CC GGAACGAGGAC CT GGTGGAC C C GT C CCT GGACC C CAAT GT AT AC AT C 

ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AC GCGGGAGCACAGC CT GGT GGT GCGACAGGCCC GCCT TGCTGACAC GGCCAACT ACAC C 

TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 

GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 

GGCT GGCAGAAACGGAGCCGGAGCTGCACCAACCC GGC GCCTCTCAACGGGGGCGCTTTC 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 

TGTGAGGGGCAGAAT GTCCAGAA AACAGCCT GC GCCACCCT GT GC C CAGT AGACGGC 

I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I 

TGTGAGGGGCAGAATGTCCATGACCGCACCGTCTCCTCTCTGCTTGTCTCTGTGGACGGC 



300 



386 



.360 



446 



420 



506 



480 



566 



540 



626 



600 



686. 



660 



746 



720 



806 



780 



866 



840 



926 



897 



986 



957 



AGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGC 104 6 



1017 



C GT GAGT GCT CT GACCC AGCACC C C GCAAC GGAGGGGAGGAGT GC C AGGGCACT GAC CT G 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
1047 C GT GAGT GCT CTGACCC AGCAC C CC GCAAC GGAGGG GAGGAGT GCC AGGGCACT GAC CT G 1106 

1018 GAC AC CC GCAACT GT ACCAGT GACCT CT GT GT ACACAGTGCTT CT GGC CCT GAGGAC GT G 1077 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
1107 GACACCCGCAACT GT ACCAGT GACCTCT GT GT AC AC AGTGCTT CT GGC CCT GAGGACGT G 1166 



Qy 1078 GCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTC 1137 

I I I I I I II II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1167 GCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTC 1226 

Qy 1138 ATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATT 1197 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1227 ATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATT 1286 

Qy 1198 CT C AC CT CAGGCTT C CAGCC C GT CAGCAT CAAGC CCAGCAAAGCAGACAAC C CC CAT CT G 1257 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1287 CT C AC CTCAGGCTT C CAGCC CGT CAGCAT CAAGC CCAGCAAAGCAGACAAC C CC CAT CT G 134 6 

Qy 1258 CTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCC 1317 

I I I II I I I I II I I I II I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I II 
Db 1347 CT CAC CAT CCAGCCGGAC CT CAG CACCACCACCACCTACCAGGGCAGTCTCTGTCCC 14 03 

Qy 1318 CGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTG 1377 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1404 CGGCAGGAT GGGCCCAGCC C CAAGTT CCAGCT CACCAAT GGGCAC CT GCTCAGC C C C CT G 1463 

Qy 1378 GGT GGCGGC CGCCACACACT GCACCACAGCT CT C CCACCT CT GAGGCC GAGGAGTT CGT C 1437 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1464 GGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTC 1523 

Qy 1438 TCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACC 14 97 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1524 TCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACC 1583 

Qy 1498 TATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTC 1557 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1584 TAT GGGACCTT CAACTT C CT CGGGGGC CGGCT GATGATC CCTAAT ACAGGT AT CAGC CT C 1643 

Qy 1558 CTCATCCCCCCAGATGCCATACCCCGAGGGAAGATCTAT GAGATCTACCTCACGCT GCAC 1617 

II I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1644 CT CATCCCCCC AGAT GCCAT ACC C C GAGGGAAGAT CTAT GAGAT CT AC CTC ACGCT GCAC 1703 

Qy 1618 AAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTT 1677 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I 
Db 1704 AAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTT 1763 

Qy 1678 AGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGT 1737 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1764 AGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGT 1823 

Qy 1738 GGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGC 1797 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1824 GGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGC 1883 

Qy 1798 TGGG AGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAG 1854 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I II I II I I I I I I I I I I I I I I I I 
Db 1884 TGGGAGCAGGAT GT GCT GCAC CT GGGC GAGGAGGCGC CCT CC CAC CTCT ACTACT GC CAG 1943 

Qy 1855 CTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGA 1914 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1944 CTGGAGGCCAGTGCCTGCTACATCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGA 2003 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1915 GAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCC 1974 

I I I I I i I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2004 GAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCC 



2063 



1975 



T GCACCT CCCT C GAGTACAACAT C CGGGTCT ACT GC CT GCAT GACAC C CAC GAT GC ACT C 2034 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2064 T GCAC CT CC CT C GAGTACAACAT CCGGGTCT ACT GC CT GCAT GACAC C CAC GAT GC ACT C 2123 

2035 AAGGAGGTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTC 2094 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2124 AAGGAGGT GGT GCAGCT GGAGAAGC AGCTGGGGGGACAGCT GAT C C AGGAG CC ACGGGT C 2183 

2095 CT GCACTT CAAGGAC AGTT AC C ACAAC CTGC GC CT AT CC AT C CAC GAT GT GCC C AGCT CC 2154 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
2184 CT GCACTT CAAGGACAGTT AC C ACAAC CTGC GC CT AT C CAT CC AC GAT GT GCC C AGCT CC 2243 



2155 CT GT GGAAGAGTAAGCT C CTT GT CAGCT AC C AGGAGAT C C C CTTTT AT CACAT CTGGAAT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2244 CT GT GGAAGAGTAAGCT C CTT GT CAGCT AC C AGGAGAT CC CCTTTT AT CACAT CTGGAAT 

2215 GGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2304 GGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGT 

2275 GACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATC 



2364 



2335 



2424 



2395 



2214 



2303 



2274 



2363 



2334 



2423 



2394 



AACTT CAACAT CAC CAAGGAC ACAAGGT TT GCT GAGCT GCT GGCT CT GGAGAGT GAAGCG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AACTT CAACAT CAC CAAGGACACAAGGTTT GCT GAGCT GCT GGCT CT GGAGAGT GAAGC G 24 83 



GGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2484 GGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAG 



2454 



2543 



2514 



2455 ATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAG 
I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I 
2544 ATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAG 2603 

2515 AAACT CCACCT GGACAGCCAT CT CAGCTTCTTT GC CT C CAAGCCC AGC C C CACAGC CAT G 2574 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2604 AAACTCCACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATG 2663 

2575 ATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCA 2634 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I 
2664 ATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCA 2723 

2635 GCAGT GGCT GGACTGGGCCAGCCAGAC GCT GGCCTCTTCACAGTGTCGGAGGCTGAGTGC 2694 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2724 GCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGC 2783 

2695 TGA 2697 
III 

2784 TGA 2786 
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ID ADH71637 standard; DNA; 2881 BP. 
XX 

AC ADH71637; 
XX 

DT 25-MAR-2004 (first entry) 
XX 

DE Human gene of the invention NOV21o SEQ ID NO: 533. 

XX . 

KW ds; gene; human; cytostatic; immunomodulator ; neuroprotective; nootropic; 

KW anorectic; antidiabetic; antimicrobial; antilipaemic; gene therapy; 

KW vaccine; cancer; cachexia; Alzheimer's disease; Parkinson's disease; 

KW obesity; diabetes; infectious disease; metabolic syndrome X; 

KW dyslipidaemia. 

XX 

OS Homo sapiens . 
XX 

PN WO2003102155-A2. 
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DR P-PSDB; ADH71638. 
XX 

PT New NOVX polypeptides and nucleic acid molecules useful for preventing or 

PT treating NOVX-associated disorders, e.g. cancer, diabetes, infection or 

PT obesity, and in chromosome mapping, tissue typing or pharmacogenomics . 
XX 

PS Example 21; SEQ ID NO 533; 1880pp; English. 
XX 

CC The invention relates to a novel isolated polypeptide (NOVX) . A 

CC polypeptide of the invention has cytostatic, immunomodulator, 

CC neuroprotective, nootropic, anorectic, antidiabetic, antimicrobial, and 

CC antilipaemic activity, and may have a use in gene therapy, and as a 

CC vaccine. The polypeptides are encoded by NOVX polynucleotides comprising 

CC any of the 303 fully defined nucleotide sequences given in the 

CC specification. The polypeptide is useful in the manufacture of a 

CC medicament for treating a syndrome associated with a human disease. The 

CC polypeptide, polynucleotide and antibody are useful in diagnosing, 

CC treating or preventing NOVX-associated disorders, e.g. cancer, cachexia, 

CC Alzheimer's disease, Parkinson's disease, obesity, diabetes, infectious 

CC diseases, metabolic syndrome X or dyslipidaemias . The nucleic acids are 

CC further used as hybridisation probes, in chromosome mapping, tissue 

CC typing, preventive medicine, and pharmacogenomics. The present sequence 

CC encodes a NOVX polypeptide of the invention. 

XX 

SQ Sequence 2881 BP; 527 A; 985 C; 867 G; 502 T; 0 U; 0 Other; 



Query Match 97.1%; Score 2619.8; DB 12; Length 2881; 

Best Local Similarity 98.9%; Pred. No. 0; 

Matches 2672; Conservative 0; Mismatches 22; Indels 9; Gaps 3; 



Qy 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 87 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 146 

Qy 61 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 147 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 206 

Qy 121 GACCT GCT TCC C CACTT CCT GGT GGAGC CC GAGGAT GT GT ACATCGTCAAGAACAAGC CA 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 207 GAC CT GCT T CC C CACTT CCT GGT GGAGC CC GAGGAT GT GT ACATC GT CAAGAACAAGC C A 266 

Qy 181 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 267 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 326 

Qy 241 TGGGT GCGC CAGGT GGACCACGT GAT C GAGC GC AGCACAGACGGGAGC AGT GGGCT GC C C 300 

I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 327 TGGGT GCGC CAGGT GGACCACGT GAT CGAGCGC AGCACAGACGGGAGCAGT GGT GAGC CG 386 

Qy 301 ACCATGGAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I , 
Db 387 ACCATGGAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAG 446 

Qy 361 GAAT ACTGGTGC CAGTGC GT GGCAT GGAGCT C CT C GGGC ACCACCAAGAGT C AGAAGGC C 420 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 447 GAAT ACTGGTGCCAGTGCGTGGCATGGAGCT CCT CGGGCACCACCAAGAGTCAGAAGGCC 506 



Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 



421 



507 



481 



567 



541 



TACAT C CGCATAGC CAGAT T GCGCAAGAACT T C GAGCAGGAGCCGCT GG CCAAGGAGGT G 480 

I I I I I I I II I I I I I II I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I II 

TACAT C CGCATAGC CAGATT GC GCAAGAACT T C GAGCAGGAGC CGCTGGCCAAGGAGGT G 566 

TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 540 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I II I I I I 

TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 62 6 



600 



GT GGAGTGGCT C CGGAACGAGGAC CT GGTGGAC C CGT CC CT GGAC C CCAAT GT AT AC AT C 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
627 GTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATC 686 



601 



687 



661 



747 



721 



807 



781 



867 



841 



927 



898 



987 



958 



ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 
I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 

TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 

I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 

GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 
I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 

GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 

TGT GAGGGGCAGAAT GT CCAGAA AACAGCCT GCGCCACCCTGT GCCCAGTAGACGGC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

TGTGAGGGGCAGAATGTCCATGACCGCACCGTCTCCTCTCTGCTTGTCTCTGTGGACGGC 



660 



746 



720 



806 



780 



866 



840 



926 



897 



986 



957 



AGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
AGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGC 1046 



CGT GAGTGCTCT GACC CAGCAC CC C GCAACGGAGGGGAGGAGT GC CAGGGCACT GAC CT G 1017 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1047 CGT GAGTGCTCT GACCCAGCACCCCGCAACGGAGGGGAGGAGT GC CAGGGCACT GACCT G 1106 

1018 GACACCCGCAACT GT ACCAGT GAC CT CT GT GT ACAC AGT GCT T CT GGCCCT GAGGAC GT G 1077 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1107 GAC ACCCGCAACTGT ACCAGT GAC CT CT GT GTACACAGT GCTT CT GGCCCT GAGGAC GT G 1166 

1078 GCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTC 1137 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1167 GCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTC 1226 

1138 ATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATT 1197 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1227 AT CCT C GTTT ATTGC CGGAAGAAGGAGGGGCT GGACT CAGAT GTGGCT GACT CGT CCATT 1286 

1198 CT CACCTCAGGCTT CCAGCCCGT CAGCAT CAAGC CCAGCAAAGCAGACAAC C C C CAT CT G 1257 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

1287 CT CACCTCAGGCTT CCAGCCCGT CAGCAT CAAGCCC AGCAAAGCAGACAACCCC C AT CT G 1346 



Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 



1258 CTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCC 1317 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I II I I I I I I I I I I I 

1347 CT CACC AT CCAGCCGGACCT C AG CACCACCACCACCTACCAGGGCAGTCTCTGTCCC 1403 

1318 CGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTG 1377 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I. I I I 

1404 CGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTG 1463 

1378 GGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTC 1437 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1464 GGT GGC GGC CGC CACACACT GCAC C ACAGCT CT CC C AC CTCT GAGGCC GAGGAGTT C GT C 1523 

1438 TCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACC 14 97 

I I I I I I I I II I I I I I I IN I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I 

1524 TCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACC 1583 

1498 T AT GGGACCTTCAACTT C CT C GGGGGC C GGCT GAT GAT C CCTAAT AC AGGT AT CAGC CT C 1557 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1584 TATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTC 1643 

1558 CTC ATCC CCCCAGAT GCCAT AC CC CGAGGGAAGAT CT AT GAGAT CTACCT CAC GCT GCAC 1617 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

1644 CTCAT CCCCCCAGAT GC CAT AC CC CGAGGGAAGAT CT AT GAGAT CTAC CT CACGCT GCAC 1703 

1618 AAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTT 1677 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1704 AAGCCGGAAGACGTGAGGTTGCCCCTAGCT GGCT GTCAGACCCT GCT GAGTCC CAT CGTT 1763 

1678 AGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGT 1737 

I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1764 AGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGT 1823 

1738 GGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGC 1797 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1824 GGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGC 1883 

1798 TGGG AGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAG 1854 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1884 T GGGAGCAGGAT GT GCTGCAC CT GGGC GAGGAGGC GC C CTC CCAC CT CT ACTACT GCCAG 1943 

1855 CTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGA 1914 

I I I I I I I I I I I I I I I I I I I I Ml I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

1944 CTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGA 2003 

1915 GAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCC 1974 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2004 GAGGCCCTCAGCGTGGCTGCCACCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCC 2063 

1975 T GCACCT CCCTCGAGT ACAACAT C C GGGT CT ACT GCCT GCAT GACACCCAC GAT GCACT C 2034 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

2064 T GCACCT CCCT CGAGT ACAACAT C C GGGT CT ACT GCCT GCAT GACACC CAC GAT GCACT C 2123 

2035 AAGGAGGTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTC 2094 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2124 AAGGAGGTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTC 2183 



Qy 



2095 CTGC ACT TCAAGGACAGTT ACC AC AACCT GC GC CTATC CAT CCAC GAT GT GC C CAGCT C C 2154 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 2184 CT GCACTT CAAGGAC AGTTAC CACAAC CTGC GCCTAT CCAT CCACGAT GT GC C CAGCT C C 2243 

Qy 2155 CTGTGGAAGAGTAAGCT CCT T GT CAGCT AC C AGGAGAT CCCCT TT TAT CAC AT CT GGAAT 2214 

1 1 1 1 1 1 1 1 1 1 1 1 r 1 1 1 1 1 1 1 1 1 1 1 1 ii 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii 1 1 1 1 1 1 1 1 

Db 2244 CT GTGGAAGAGTAAGCT CCT T GT CAGCT AC C AGGAGAT CC CCTTTTAT CAC AT CT GGAAT 2303 

Qy 2215 GGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGT 2274 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2304 GGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGT 2363 

Qy 2275 GACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATC 1 2334 

I I I I I I I I I I I I I I I I I I. I I I I I I I I I I I II II I I I I I I I I II I I I I I II I I I I I I I I I I 
Db 2364 GACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATC 2423 

Qy 2335 AACTT CAACAT CAC CAAGGACACAAGGT TT GCT GAGCTGCTGGCT CT GGAGAGT GAAGCG 2394 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2424 AACTT CAACAT CAC CAAGGACACAAGGTTT GCT GAGCTGCTGGCT CT GGAGAGT GAAGC G 2483 

Qy 2395 GGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAG 2454 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I 
Db 2484 GGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAG 2543 

Qy 2455 ATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAG 2514 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2544 ATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAG 2603 

Qy 2515 AAACT CCAC CT GGACAGC CAT CT CAGCTTCT TT GCCT CCAAGC CC AGCCCCACAGC C ATG 2574 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 2604 AAACTCCACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATG 2663 

Qy 2575 ATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCA 2634 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I J I I I I I I I I I I I I I I I I 
Db 2664 ATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCA 2723 

Qy 2635 GCAGT GGCT GGACTGGGC CAGCCAGACGCT GGC CT CTTCACAGT GT CGGAGGCT GAGT GC 2694 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 2724 GCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGC 2783 

Qy 2695 TGA 2697 

III 

Db 2784 TGA 2786 



RESULT 10 
ADH71641 

ID ADH71641 standard; DNA; 2881 BP. 
XX 

AC ADH71641; 
XX 

DT 25-MAR-2004 (first entry) 
XX 

DE Human gene of the invention NOV21q SEQ ID NO: 537. 
XX 

KW ds; gene; human; cytostatic; immunomodulator ; neuroprotective; nootropic; 

KW anorectic; antidiabetic; antimicrobial; antilipaemic; gene therapy; 

KW vaccine; cancer; cachexia; Alzheimer's disease; Parkinson f s disease; 



KW obesity; diabetes; infectious disease; metabolic syndrome X; 

KW dyslipidaemia. 

XX 

OS Homo sapiens . 
XX 

PN WO2003102155-A2. 
XX 





11- 




2003. 




vv 

XX 












Ti TP 

PF 


n o 
Uo- 


T7 TVT 

JUN- 


2003; 2003WO- 


TTom o/i on 
UoUl /4oU . 


XX 












nn 
PR 


n o 


TT TXT 

JUN- 


o n n o 
ZUUZ , 


• OAAOTTO 

? ZUUzUS- 


AAQC1 AAn 

UooOlzUP . 


PR 


a a 


JUN- 


ZUUZ , 


; zuuzub- 


Uooo / o4r . 


PR 


a c 


JUN- 


o a a o 
ZUUZ , 


• O A A Otto 

; ZUUZUS- 


U>dod041P . 


PR 


a c 

05- 


JUN- 


ZUUZ , 


O A A OTT C 

; zOOzUS- 


mo^ Ail On 

038604 /P . 


PR 


06- 


JUN- 


o a a o 


, O A A OTT O 

' ZU02US- 


AOO^OO^n 

03863 /6P . 


PR 


A c 

ub- 


JUN- 


O A A O 

ZUUZ , 


, OAAOTTC? 

f ZUUzUS- 


a i o a a ton 
U38o4b or . 


PR 


06- 


JUN- 


o a a o 
Z UUZ , 


> O A A Otto 

i ZUUZUS- 


AO O (COf il n 

0386864P . 


PR 


06- 


JUN- 


o a a o 

2002 , 


; 2002US- 


AAOTA1 /"n 

0387016P . 


PR 


07- 


JUN- 


2002 , 


O a Otto 

' 2002US- 


0386796P . 


PR 


07- 


JUN- 


2002 , 


; 2002US- 


0386816P . 


PR 


a o 

07- 


JUN- 


o n n o 

2002 , 


r 2002US- 


0386931P . 


PR 


07- 


JUN- 


2002 , 


A AAATin 

r 2002US- 


A A O A /I On 

0386942P . 


PR 


07- 


JUN- 


2002 j 


? 2002US- 


0386971P. 


PR 


07- 


JUN- 


2002 , 


; 2002US- 


0387262P . 


PR 


08- 


JUN- 


2002 , 


r 2002US- 


0296960P . 


PR 


10- 


JUN- 


2002 , 


; 2002US- 


nOQT /I AAn 

0387400P . 


PR 


10- 


JUN- 


2002 , 


O f\ f\ O T T 

; 2002US- 


0387535P . 


PR 


11- 


JUN- 


o a a o 

2002 , 


O A A Arm 

? 2002US- 


0387610P. 


PR 


11- 


JUN- 


2002 j 


A AA ATTC 

; 2002US- 


0387625P. 


PR 


11- 


JUN- 


i a a o 

2002 j 


A AAAttfi 

; 2002US- 


0387634P . 


PR 


11- 


JUN- 


O A A O 

2002 , 


A AAATTn 

; 2002US- 


AOOTff On 

0387668P . 


PR 


11- 


JUN- 


O A A O 

zvuz , 


• oaaotto 

' ZUUZUS- 


0387696P . 


PR 


11- 


JUN- 


O A A O 


O A A ot t o 

; Z002US- 


0387702P . 


PR 


11- 


JUN- 


O A A O 

ZVUZ t 


• oaaotto 

; zUUzUS- 


0387836P . 


PR 


11- 


JUN- 


o a n o 
ZUUZ , 


• o A A Otto 
ZUUZU5- 


AOOOOCAn 

03878b9P . 


PR 


1 O 

lz- 


JUN- 


o nno 
ZUUZ , 


» o n n otto 
* ZUUZUb - 


AOOOQOOn 

U38 /yooP . 


PR 


1 o 
1Z~ 


JUN- 


onno 
ZUUZ t 


» onnOTTo_ 
! ZUUZUo - 


Uoo /yo4P . 


PR 


1 o 

12- 


JUN- 


ZUUZ , 


► onnoiTc — 
f ZUUZUo 


AOOOA^An 

0387960P . 


on 
rK 


1 o 


TTTXT 


onno 
ZUUZ < 


» o n n ottq_ 

? ZUUZUo 


noQQnoon 
Uoo oUZZr • 


rK 


1 o 
1Z - 




onno 
z uuz < 


onnoiTQ— 

ZUUZUo 


UoooUy br . 


rK 


i o 


U UN 


onno 
z u uz < 


» onnoiTQ— 

> ZUUZUO 


nOQQI OOD 

Ujo y IZor . 


nn 
rK 


1 A — 
14 


J UN 


2002, 


* 2002US- 


nOPQI 1 flD 

Uooyiior . 


rK 


1 A 

14- 


TT TTvT 


2002, 


; 2002US- 


AQQQ1 OAn 

Uoo y 1Z Ur . 


DD 

rK 


14 


TTTTVT 


2002, 


; 2002US- 


AOQQT A AT> 

Uooyi44r- 


PR 


14- 


JUN- 


2002, 


; 2002US- 


0389146P. 


PR 


17- 


JUN- 


2002, 


; 2002US- 


0389729P. 


PR 


17- 


JUN- 


2002, 


j 2002US- 


0389742P. 


PR 


18- 


JUN- 


2002, 


j 2002US- 


0389884P. 


PR 


19- 


JUN- 


2002, 


; 2002US- 


0390006P. 


PR 


19- 


JUN- 


2002, 


; 2002US- 


0390209P. 


PR 


21- 


JUN- 


2002, 


p 2002US- 


0390763P. 


PR 


17- 


JUL- 


2002, 


; 2002US- 


0396706P. 


PR 


06- 


AUG- 


2002, 


; 2002US- 


0401628P. 


PR 


09- 


AUG- 


2002, 


r 2002US- 


0402156P. 


PR 


09- 


AUG- 


2002, 


j 2002US- 


0402256P. 


PR 


09- 


AUG- 


2002, 


; 2002US- 


0402389P. 



PR 
PR 
PR 
PR 
PR 
PR 
PR 
PR 
PR 
PR 
PR 
PR 
PR 
PR 
PR 
PR 
PR 
PR 
PR 
PR 
PR 
PR 
PR 
PR 
PR 
PR 
PR 
PR 
PR 
PR 
XX 
PA 
XX 
PI 
PI 
PI 
PI 
PI 
PI 
PI 
PI 
PI 
XX 
DR 
DR 
XX 
PT 
PT 
PT 
XX 
PS 
XX 

cc 
cc 
cc 
cc 
cc 



1 9 

X c. 


- ATTH- 


£m \J \J Cm i 


• 900911^- 


ui ut, / our • 


1 9 

X c. 


- ATTH- 


-9009 

C.\J\J C. 


• 900911^- 


04 09 R1 fiP 


1 9 
X £. 




•9009 




04 09 R91 P 


1 9 
x^ 




-900? 

Cm \J \J 


■ 9009II C ;- 


04 09R^9P 


1 ^ 
X o 


- ATTC- 


9009 

C.KJ \J *L 


• 900911^- 

p ^ W U *1 u o 


04 0^4 4 ftp 


1 *3 


- AT J(Z- 


-9009 


. 9009!!^- 


040^4 C »QP 


1 "3 
x o 




-9009 
z. u u z. 


9009TTC! — 


04 O^R^I P 
uiu jjJir • 


1 ^ 


- AT \C— 


•9009 


• 9009TT C 1- 


04 0^ S^9P 


1 "3 

X O 


- ATTr*- 


9009 


. 9009TTC!- 

p ZUUZU O 


04 0^ Sfi^P 

Ufi UjJ DOir • 


X O 




9009 


9009TTc;_ 


040^^1 IP 

U1UOOX /Cm 


1 ^ 


— 7\T Tr* — 


• 9009 
ZUUZ < 


9009TTc:_ 


04 O^^l *7P 


Z D 




-9 009 
ZUUZ , 


9009TTC — 
r ZUUZUo 


040£1 R9P 
U'lUOiOZir* 


9 £ 
Z D 


- ATTr*- 


• 9009 


9009TTQ — 


04 Hfi^^SP 
UlUDjJJr . 


z i 


— AT Tr* — 


-9 HH9 
ZUUZ j 




Ufl UOZ ft Uir . 


1 9 
±Z 




9009 
ZUUZ i 


9 0 H9TTQ — 


o/ii ooftzip 

KJH. XUUOflir . 


9 n 
z u 




9 009 
Z U UZ j 


9009TTQ — 
Z UUZ U O 


n4 1 9 ROflD 
U*i XZ DZ o it . 


9 "3. 
Z O 




9009 
Z U UZ ( 


. 9A09TTQ — 
Z U UZ U O 


041 01*31 p 
UflXZ / OXlr. 


^o 




• 9009 
Z UUZ , 


, 9H09TTQ — 
ZUUZUO 


041 4 P 01 P 
Ufl X*± O UXir • 


ou 




9 nn9 
zuuz , 


ZUUZUo 








.9 nno 

ZUUZ i 


ZUUZUo 


Ufi xf4 Ulr . 


■^o 


oil* lr 


9009 
ZUUZ i 


ZUUZUo 


Ufi Xfl y Ofl C m 


no 




•Z u u z , 


• 9 n H9TTC — 
' ZUUZUo 


Ufi X / ±0 01: • 


HQ 




9009 
Z UUZ , 


i 9H09TTc:_ 
ZUUZUO 


04174 OfiP 
U ft X / H U Dir • 


9 ^ 

Zo 




9 nno 
zuuz , 


» 9009TTC: — 
J ZUUZUo 


UftZ UOoyJr . 


28- 


-OCT- 


o n o 
2002 , 


• 2uu2US- 


0421156P . 


31 


-OCT- 


2002, 


• 2002US- 


0422690P. 


01 


-NOV- 


2002, 


! 2002US- 


0423130P. 


05 


-NOV- 


2002, 


? 2002US- 


00423798. 


05 


-NOV- 


2002, 


• 2002US- 


0423798P. 


12 


-NOV- 


2002, 


• 2002US- 


0425453P. 



(CURA-) CURAGEN CORP. 

Alsobrook JP f Alvarez E, Anderson DW, Boldog FL, Gasman SJ; 
Catterton Chapoval A, Crabtree-Bokor JR, Edinger SR, Ellerman K; 

Ettenberg Gangolli EA, Gerlach VL, Gorman Gunther E, Guo X; 

Gusev VY, Herrmann JL, Ji W, Kekuda R, Li L, Liu X, Macdougall JR; 
Maclachlan T, Malyankar UM, Mezick AJ, Millet I, Mishra VS; 
Padigaru M, Patturajan M, Pena CEA, Peyman JA, Raha D, Rastelli L; 
Rothenberg ME, Sciore P, Shenoy SG, Shimkets RA; 
Spytek KA, Stone DJ, Vernet CAM f Voss EZ, Zhong M; 



Rieger DK, 
Smithson G, 
Zhong H; 



useful for preventing or 
diabetes, infection or 



WPI; 2004-081935/08. 
P-PSDB; ADH71642. 

New N0VX polypeptides and nucleic acid molecules 
treating NOVX-associated disorders, e.g. cancer, 
obesity, and in chromosome mapping, tissue typing or pharmacogenomics . 

Example 21; SEQ ID NO 537; 1880pp; English. 

The invention relates to a novel isolated polypeptide (N0VX) . A 
polypeptide of the invention has cytostatic, immunomodulator, 
neuroprotective, nootropic, anorectic, antidiabetic, antimicrobial, and 
antilipaemic activity, and may have a use in gene therapy, and as a 
vaccine. The polypeptides are encoded by N0VX polynucleotides comprising 



CC any of the 303 fully defined nucleotide sequences given in the 

CC specification. The polypeptide is useful in the manufacture of a 

CC medicament for treating a syndrome associated with a human disease. The 

CC polypeptide, polynucleotide and antibody are useful in diagnosing, 

CC treating or preventing NOVX-associated disorders, e.g. cancer, cachexia, 

CC Alzheimer's disease, Parkinson's disease, obesity, diabetes, infectious 

CC diseases, metabolic syndrome X or dyslipidaemias . The nucleic acids are 

CC further used as hybridisation probes, in chromosome mapping, tissue 

CC typing, preventive medicine, and pharmacogenomics . The present sequence 

CC encodes a NOVX polypeptide of the invention. . 

XX 

SQ Sequence 2881 BP; 526 A; 986 C; 867 G; 502 T; 0 U; 0 Other; 



Query Match 97.1%; Score 2619.8; DB 12; Length 2881; 

Best Local Similarity 98.9%; Pred. No. 0; 

Matches 2672; Conservative 0; Mismatches 22; Indels 9; Gaps 3; 



Qy 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 

I I I I I I I I I II I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 87 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 146 

Qy 61 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 147 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 206 

Qy 121 GACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATGTGTACATCGTCAAGAACAAGCCA 180 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 207 GACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATGTGTACATCGTCAAGAACAAGCCA 266 

Qy 181 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 267 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 326 

Qy 241 TGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGGCTGCCC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I III 
Db 327 TGGGT GCGCCAGGT GGACCACGT GAT C GAGCGCAGC ACAGACGGGAGCAGT GGT GAGCC G 386 

Qy 301 AC CAT GGAGGT C CGCATTAAT GT CT CAAGGCAGC AGGTCGAGAAGGTGTTC GGGCT GGAG 360 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 387 ACCAT GGAGGT C CGCATTAAT GT CTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCT GGAG 446 

Qy 361 GAATACTGGT GC CAGTGC GT GGCAT GGAGCT CCT CGGGCACC AC CAAGAGT CAGAAGGC C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 447 GAATACTGGT GCCAGT GCGT GGCAT GGAGCT C CT CGGGCACCAC CAAGAGT CAGAAGGC C 506 

Qy 421 TACAT C CGCAT AGC CAGAT T GC GCAAGAACTT C GAGCAGGAGC CGCT GGCCAAGGAGGT G 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 507 TACAT C CGCAT AGC CAGAT T GC GCAAGAACTT CGAGCAGGAGC CGCTGGCCAAGGAGGT G 566 

Qy 481 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 567 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 626 

Qy 541 GT GGAGTGGCT C C GGAACGAGGACCT GGT GGACC CGT CCCT GGAC C CCAAT GTAT ACAT C 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 627 GT GGAGTGGCT C CGGAAC GAGGACCT GGT GGAC C CGT CCCT GGACCCCAAT GTAT ACAT C 686 
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Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 



601 



687 



661 



747 



721 



807 



781 



867 



841 



927 



898 



987 



958 



ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 

I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACGCGGGAGC ACAGCCTGGT GGT GC GACAGGC C C GCCTTGCT GACACGGCCAACT ACACC 

TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 

I I II I I I I i I I I I I I I I I I I I I I I i I I I I I I I I l-l I I I I I I I I I I I I I I I I I I I I I I I I I 
TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 

GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 

I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 

GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 

TGTGAGGGGCAGAAT GTCCAGAA AACAGCCT GC GC CAC C CTGT GC C CAGT AGACGGC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I 

TGTGAGGGGCAGAATGTCCATGACCGCACCGTCTCCTCTCTGCTTGTCTCTGTGGACGGC 



660 



746 



720 



806 



780 



866 



840 



926 



897 



986 



957 



AGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I U I I I I I I I I I 

AGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGC 104 6 



CGT GAGT GCT CT GAC C CAGCAC C C CGCAACGGAGGGGAGGAGT GC CAGGGCACT GACCT G 1017 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1047 CGT GAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACT GACCT G 1106 

1018 GACAC CC GCAACTGT ACC AGT GAC CTCT GTGT AC ACAGT GCTT CT GGCCCT GAGGACGT G 1077 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I 
1107 GACACCC GCAACTGT ACC AGT GAC CTCT GT GT AC ACAGTGCTT CT GGCCCT GAGGACGT G 1166 

1078 GCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTC 1137 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1167 GCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTC 1226 

1138 ATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATT 1197 

. I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1227 AT C CT CGTTT ATTGC CGGAAGAAGGAGGGGCT GGACT CAGAT GTGGCT GACT CGT C CATT 1286 

1198 CT C ACCT CAGGCTT CCAGC CC GT CAGCAT CAAGC CCAGCAAAGCAGACAAC CCCCATCT G 1257 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CT CACCT CAGGCTT CCAGCCC GT CAGCAT CAAGC CCAGCAAAGCAGACAAC CCCCATCT G 1346 



1287 



1258 



CTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1347 CT C ACCAT CCAGCC GGACCT C AG CACCACCACCACCTACCAGGGCAGTCTCTGTCCC 



1317 



1403 



1318 CGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTG 1377 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1404 CGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTG 



1378 



1463 



GGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTC 1437 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

1464 GGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTC 152*3 

1438 TCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACC 1497 
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Qy 

Db 

Qy 
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Qy 
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Qy 
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Qy 

Db 

Qy 
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Qy 

Db 

Qy 



1524 



1498 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACC 



1583 



1557 



TATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTC 
I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I II I I I I I II I I I I I I I I I I I I I 
1584 T AT GGGAC CTT CAACTT C CT CGGGGGC C GGCT GAT GATC C CTAAT AC AGGT AT C AGC CT C 1643 

1558 CT CAT C CC C CC AGAT GCC AT ACC CC GAGGGAAGAT CT AT GAGATCT AC CT C ACGCT GCAC 1617 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
1644 CT CAT CCCC CCAGAT GC CAT AC CCC GAGGGAAGAT CT AT GAGATCT AC CT C AC GCT GCAC 1703 

1618 AAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTT 1677 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
1704 AAGCCGGAAGAC GT GAGGT T GC CCCT AGCT GGCT GT C AGACC CTG CT GAGT C CCAT C GTT 1763 

1678 AGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGT 1737 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I 
1764 AGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGT 1823 

1738 GGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGC 1797 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1824 GGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGC 1883 

1798 TGGG AGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAG 1854 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1884 TGGGAGCAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAG 1943 

1855 CTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGA 1914 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1944 CTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGA 2003 

1915 GAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCC 1974 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I 
2004 GAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCC 2063 

1975 TGCAC CTC CCT CGAGT ACAAC AT CC GGGT CTACT GCCTGCAT GACACC C ACGAT GCACT C 2034 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
2064 TGCAC CT C CCTCGAGTACAACAT CC GGGTCTACT GCCTGCAT GACACCC AC GAT GCACT C 2123 

2035 AAGGAGGT GGT GCAGCT GGAGAAGCAGCT GGGGGGAC AGCT GAT C CAGGAGCCAC GGGT C 2094 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2124 AAGGAGCT GGT GCAGCT GGAGAAGCAGCT GGGGGGAC AGCTGATC CAGGAGCCAC GGGT C 



2095 CT GCACTT CAAGGACAGTT ACCACAAC CT GCGC CTAT CCATC CACGAT GT GCC CAGCT CC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2184 CT GCACTT CAAGGACAGT T AC CACAACCT GCGC CTAT CCATCCAC GAT GT GCC CAGCT CC 



2155 



2244 



2215 



CT GTGGAAGAGTAAG CT C CTT GT CAGCT AC CAGGAGAT C C CCTTTT AT CAC AT CT GGAAT 
I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CT GTGGAAGAGT AAGCT CCTT GT CAGCT AC CAG GAGATC CCCT TTT AT CAC AT CT GGAAT 



GGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGT 
I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2304 GGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGT 



2183 



2154 



2243 



2214 



2303 



2274 



2363 



2275 GACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATC 2334 
I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 



Db 2364 GACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATC 2423 

Qy 2335 AACTTCAACATCACCAAGGAC ACAAGGTTT GCT GAGCT GCT GGCT CT GGAGAGT GAAGC G 2394 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2424 AACTTCAACAT CACCAAGGAC ACAAGGTTT GCT GAGCT GCT GGCT CT GGAGAGT GAAGC G 2483 

Qy 2395 GGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAG 2454 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2484 GGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAG 2543 

Qy 2455 ATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAG 2514 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2544 ATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAG 2603 

Qy 2515 AAACTCCACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATG 2574 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2604 AAACTCCACCTGGACAGCCAT CT CAGCTT CTTT GC CT C CAAGCC CAGCCC CAC AGC C AT G 2663 

Qy 2575 ATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCA 2634 

I I I I I I II I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I 

Db 2664 ATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCA 2723 

Qy 2635 GCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGC 2694 

I I I I I I I I II I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2724 GCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGC 2783 

Qy 2695 TGA 2697 

I I I 

Db 2784 TGA 2786 



RESULT 11 
ADH71629 

ID ADH71629 standard; DNA; 2881 BP. 
XX 

AC ADH7162 9; 
XX 

DT 25-MAR-2004 (first entry) 
XX 

DE Human gene of the invention NOV21k SEQ ID NO: 525. 
XX 

KW ds; gene; human; cytostatic; immunomodulator ; neuroprotective; nootropic; 

KW anorectic; antidiabetic; antimicrobial; antilipaemic; gene therapy; 

KW vaccine; cancer; cachexia; Alzheimer f s disease; Parkinson's disease; 

KW obesity; diabetes; infectious disease; metabolic syndrome X; 

KW dyslipidaemia. 

XX 

OS Homo sapiens. 
XX 

PN WO2003102155-A2 . 
XX 

PD ll-DEC-2003. 
XX 

PF 03-JUN-2003; 2003WO-US017430 . 
XX 

PR 03-JUN-2002; 2002US-0385120P . 

PR 04-JUN-2002; 2002US-0385784P . 
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WPI; 2004-081935/08. 
P-PSDB; ADH71630. 

New NOVX polypeptides and nucleic acid molecules 
treating NOVX-associated disorders, e.g. cancer, 
obesity, and in chromosome mapping, tissue typing or pharmacogenomics . 

Example 21; SEQ ID NO 525; 1880pp; English. 

The invention relates to a novel isolated polypeptide (NOVX) . A 
polypeptide of the invention has cytostatic, immunomodulator, 
neuroprotective, nootropic, anorectic, antidiabetic, antimicrobial, and 
antilipaemic activity, and may have a use in gene therapy, and as a 
vaccine. The polypeptides are encoded by NOVX polynucleotides comprising 
any of the 303 fully defined nucleotide sequences given in the 
specification. The polypeptide is useful in the manufacture of a 
medicament for treating a syndrome associated with a human disease. The 
polypeptide, polynucleotide and antibody are useful in diagnosing, 
treating or preventing NOVX-associated disorders, e.g. cancer, cachexia, 
Alzheimer's disease, Parkinson's disease, obesity, diabetes, infectious 
diseases, metabolic syndrome X or dyslipidaemias . The nucleic acids are 
further used as hybridisation probes, in chromosome mapping, tissue 
typing, preventive medicine, and pharmacogenomics. The present sequence 
encodes a NOVX polypeptide of the invention. 

Sequence 2881 BP; 526 A; 986 C; 868 G; 501 T; 0 U; 0 Other; 



Query Match 97.1%; Score 2619.8; DB 12; Length 2881; 

Best Local Similarity 98.9%; Pred. No. 0; 

Matches 2672; Conservative 0; Mismatches 22; Indels 9; Gaps 



3; 



Qy 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 87 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 14 6 

Qy 61 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 120 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 147 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 206 

Qy 121 GACCT GCTT C CC CACT T C CT GGT GGAGC CCGAGGAT GT GTAC ATC GT CAAGAACAAGCC A 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 207 GACCT GCT T CC CCACTT C CT GGT GGAGC CCGAG GAT GT GT AC ATCGT CAAGAACAAGCCA 266 

Qy 181 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 267 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 326 

Qy 241 TGGGT GCGC CAGGT GGACCACGT GAT CGAGCGCAGC ACAGAC GGGAGCAGT GGGCT GC C C 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 327 TGGGT GCGC CAGGT GGACCAC GT GAT C GAGCGCAGC ACAGAC GGGAGCAGT GGT GAGC C G 386 

Qy 301 ACCATGGAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAG 360 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 387 ACCAT GGAGGT C CGCATTAAT GT CT CAAGGCAGCAGGT CGAGAAGGTGTT C GGGCT GGAG 446 

Qy 361 GAATACTGGT GC CAGT GC GT GGCAT GGAGCTCCT C GGGCACC ACCAAGAGT CAGAAGGC C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 447 GAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCC 506 

Qy 421 TACAT C CGCAT AGC CAGATT GCGCAAGAACTT CGAGCAGGAGC CGCTGGC CAAGGAGGT G 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 507 TACATCCGCATAGCCAGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTG 566 

Qy 4 81 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 567 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 626 

Qy 541 GT GGAGTGGCT CCGGAAC GAGGAC CTGGTGGACC CGT CCCTGGAC C CCAAT GTAT ACAT C 600 

I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 627 GTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAAT GTAT ACAT C 686 

Qy 601 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 687 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 746 

Qy 661 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 747 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 806 

Qy 721 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 807 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 866 

Qy 781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 840 



Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 



867 



841 



927 



898 



987 



958 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I II I I 

GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 926 

T GT GAGGGGCAGAAT GT CCAGAA AACAGCCTGCGCCACCCTGTGCCCAGTAGACGGC 897 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

T GT GAGGGGCAGAAT GT CCAT GAG CGCACC GTCT CCT CT CT GCT T GT CT CT GT GGAC GGC 986 

AGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGC 957 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

AGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGC 1046 



1017 



CGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I 
1047 C GT GAGT GCT CT GAC CCAGC ACC C CGCAAC GGAGGGGAGGAGT GCCAGGGCACT GAC CT G 1106 

1018 GACAC CCGCAACT GTACCAGT GACCT CT GT GT AC AC AGT GCTT CT GGC CCT GAGGACGT G 1077 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I 
1107 GACACCCGCAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTG 1166 

1078 GCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTC 1137 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
1167 GCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCCC 1226 

1138 AT CCT CGT TT AT T GC CGGAAGAAGGAGGGGCT GGACT CAGATGT GGCT GACTC GT C CATT 1197 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I II I I I I I I I I I I 
ATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATT 1286 



1227 



1257 



1198 CT CACCT CAGGCTT C CAGCCCGT CAGCATCAAGC C CAGCAAAGCAGACAACCCCCAT CT G 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1287 CT CACCT CAGGCT T CCAGCCC GT C AGCAT CAAGC C C AGCAAAGCAGACAAC CC CC AT CT G 1346 

1258 CTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCC 1317 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I 
1347 CT CAC CAT CCAGC C GGAC CT CAG CACCACCACCACCTACCAGGGCAGTCTCTGTCCC 14 03 

1318 CGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTG 1377 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1404 CGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTG 1463 

1378 GGT GGCGGCC GCCACACACT GCACCACAGCT CT CC CAC CT CTGAGGCC GAGGAGT T CGT C 1437 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1464 GGTGGCGGCC GCCACACACT GCACCACAGCT CT C CCAC CT CTGAGGC CGAGGAGTT CGT C 1523 

1438 TCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACC 1497 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I 
TCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACC 1583 



1524 



1498 



TATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1584 TATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTC 



1558 



1557 



1643 



1617 



CT CAT CCCCC CAGAT GC CATACC CCGAGGGAAGAT CT AT GAGAT CT AC CT CACGCT GCAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1644 CT CAT CCC CC CAGAT GCCAT ACC C C GAGGGAAGAT CTAT GAGAT CT AC CT CAC GCT GCAC 1703 

1618 AAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTT 1677 
I II I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I 



Db 1704 AAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTT 1763 

Qy 1678 AGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGT 1737 

I I I I I I I I II I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I M I M II 
Db 1764 AGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGT 1823 

Qy 1738 GGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGC 1797 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1824 GGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGC 1883 

Qy 1798 TGGG AGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAG 1854 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1884 TGGGAGCAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAG 1943 

Qy 1855 CTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGA 1914 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1944 CTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGA 2003 

Qy 1915 GAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCC 1974 

I I I I I I I I I I I II I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2004 GAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCC 2063 

Qy 1975 T GCACCT C CCT CGAGT ACAAC AT CCGGGTCTACT GCCT GC ATGAC AC C CACGAT GC ACT C 2034 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2064 T GCACCT CCCT CGAGTACAACAT CC GGGT CT ACT GCCT GC ATGAC AC CCAC GAT GCACT C 2123 

Qy 2035 AAGGAGGT GGT GCAGCT GGAGAAGCAGCTGGGGGGACAGCT GAT. CCAGGAGCCACGGGT C 2094 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2124 AAGGAGGT GGT GCAGCT GGAGAAGCAGCTGGGGGGACAGCT GAT CCAGGAGCCACGGGT C 2183 

Qy 2095 CTGCACTTCAAGGACAGTTACCACAACCTGCGCCTAT CCAT CCACGAT GT GCCCAGCT CC 2154 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2184 CT GCACTT CAAGGACAGTTACCACAAC CTGCGC CT AT CCAT CCACGAT GT GCC C AGCT CC 2243 

Qy 2155 CT GT GGAAGAGTAAGCT CCTT GT CAGCT ACCAGGAGAT CCCCTT T TAT CACAT CTGGAAT 2214 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2244 CT GT GGAAGAGTAAGCT CCTT GT CAGCT ACCAGGAGAT CC CCTTTT AT CACAT CTGGAAT 2303 

Qy 2215 GGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGT 2274 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 2304 GGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGT 2363 

Qy 2275 GACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATC 2334 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2364 GACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATC 2423 

Qy 2335 AACTT CAACAT CAC CAAGGACACAAGGTTT GCT GAGCT GCT GGCT CT GGAGAGT GAAGCG 2394 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2424 AACTTCAACAT CAC CAAGGACACAAGGTTT GCT GAGCT GCT GGCTCT GGAGAGT GAAGCG 2483 

Qy 2395 GGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAG 2454 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2484 GGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAG 2543 

Qy 2455 ATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAG 2514 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 2544 ATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAG 2603 



Qy 2515 AAACTCCACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATG 2574 

II I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I t I I I I I I I I I I I 
Db 2604 AAACTCCACCT GGACAGCCAT CT CAGCTT CT TTGC CT C CAAGC C C AGC C C CAC AGCCAT G 2663 

Qy 2575 ATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCA 2634 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2664 ATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCA 2723 

Qy 2635 GCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGC 2694 

I I I I I I I I I II I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2724 GCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGC 2783 

Qy 2695 TGA 2697 

I I I 

Db 2784 TGA 2786 



RESULT 12 
ADH71631 

ID ADH71631 standard; DNA; 2881 BP. 
XX 

AC ADH71631; 
XX 

DT 25-MAR-2004 (first entry) 
XX 

DE Human gene of the invention NOV211 SEQ ID NO: 527. 
XX 

KW ds; gene; human; cytostatic; immunomodulator ; neuroprotective; nootropic; 

KW anorectic; antidiabetic; antimicrobial; antilipaemic; gene therapy; 

KW vaccine; cancer; cachexia; Alzheimer's disease; Parkinson's disease; 

KW obesity; diabetes; infectious disease; metabolic syndrome X; 

KW dyslipidaemia . 

XX 

OS Homo sapiens. 
XX 

PN WO2003102155-A2. 
XX 



PD 


11- 


DEC- 


2003. 






XX 












PF 


03- 


JUN- 


2003; 


2003WO- 


US017430. 


XX 












PR 


03- 


JUN- 


2002; 


2002US- 


0385120P. 


PR 


04- 


JUN- 


2002; 


2002US- 


0385784P. 


PR 


05- 


JUN- 


2002; 


2002US- 


0386041P. 


PR 


05- 


JUN- 


2002; 


2002US- 


0386047P. 


PR 


06- 


JUN- 


2002; 


2002US- 


0386376P. 


PR 


06- 


JUN- 


2002; 


2002US- 


0386453P. 


PR 


06- 


JUN- 


2002; 


2002US- 


0386864P. 


PR 


06- 


JUN- 


2002; 


2002US- 


0387016P. 


PR 


07- 


JUN- 


2002; 


2002US- 


0386796P. 


PR 


07- 


JUN- 


2002; 


2002US- 


0386816P. 


PR 


07- 


JUN- 


2002; 


2002US- 


0386931P. 


PR 


07- 


JUN- 


2002; 


2002US- 


0386942P. 


PR 


07- 


JUN- 


2002; 


2002US- 


0386971P. 


PR 


07- 


JUN- 


2002; 


2002US- 


0387262P. 


PR 


08- 


JUN- 


2002; 


2002US- 


0296960P. 



PR 

jr r\ 


1 0 

X \J 


— iTT IN - 


■2009 • 


PR 

XT f\ 


i o 


- JUN- 


■2002 ; 


PR 

xr r\ 


X X 


-iTTJM- 

UU1M 


•200? • 


PR 


1 1 
X X 


UU1M 


•200? • 


PR 

XT r\ 


1 1 

X X 




•2002 ; 


PR 

Jr r\ 


X X 


-■TTIM- 

U \J Vi 


Cm \J V Cm f 


PR 


11 


- JUN- 


•2002 ; 


PR 

XT r\ 


1 1 

X X 


— iTT JM— 




PR 


1 1 
x x 


O UlN 




PR 

Jr r\ 


1 1 

X X 


-.TTTM- 

U UJN 


-9 009 • 


PR 


1 9 


— .TT TM— 
U UJM 


9 009 • 


PR 

Jr r\ 


1 9 


— .TT TM— 
U UJM 


9 009 ■ 


PR 

JT J"\ 


1 9 


-.TTTM- 


9 009 • 


Jr K 


1 9 
XZ 


_ TT TM — 
O UJM 


9009 • 

Z U UZ r 


DD 
JrK 


1 9 
XZ 


— TTTM — 
O UJM 


9009 • 
Z U UZ / 


PR 

JrK 




- TTTM- 
U UJM 


9 0 09* 
Z U UZ / 


PR 


1 A 


— .TTTM- 
U UJM 


9009 • 
zuuz , 


PR 


XI 


-.TTTM- 
U UJM 


9009 • 

Z U UZ f 


DP 
JrK 


1 A 
XfJ 


— TTTM— 
O UlM 


9009 • 
Z UUZ / 


PR 


X*i 


— TTTM- 
vj UJM 


9009 • 
Z U UZ / 


PR 

JrK 


1 7 
X / 


— TTTM- 


9009 • 
Z UUZ / 


PR 


1 7 
X / 


TTTM- 

U UJM 


9009 • 

Z U UZ / 


PR 

XT X\ 


1 ft 
X o 


— .TTTM- 
U UJM 


9009 ♦ 

Z U UZ r 


JrK 


1 Q 


_ TTTM — 
U UJM 


9009 • 
Z U UZ f 


PR 


1 Q 

X 17 


— TTTM — 
U UIM 


9009 • 

Z U UZ / 


PR 
JTK 


91 
Z X 


— TTTM — 
U UJM 


9 0 09 • 
z u uz , 


DP 


1 7 
X / 


— TTTT — 
J UXj 


9 009 • 
Z UUZ / 


PP 

Jr K 


0£ 




9009 • 
Z U UZ / 


DD 
JrK 


HQ 


_ATTr' — 


9 009 • 
Z U UZ , 


DD 

rK 


OQ 




9 0 09 • 
Z U UZ / 


PR 


HQ 




9009 • 
Z U UZ / 


PP 

JrK 


1 9 

xz 


— ATTr* — 


9 009 • 
Z UUZ r 


PR 


1 9 
XZ 


_ A Hf — 


9009 • 
Z U UZ / 


PR 

JrK 


1 9 
XZ 




9 009* 


PR 

JTK 


1 9 
XZ 




9 009 • 
Z UUZ / 


PR 
JTK 




— ZVTTr* — 


9 009 • 
Z UUZ / 


PR 

xT r\ 




— ATTfZ— 


9 009 • 
Z U UZ r 


PR 
JT r\ 






9009 • 
Z U UZ / 


PP 

IT K 


xo 




9 0 09 • 
Z U UZ f 


PR 

xT r\ 


xo 


— AT TfZ— 


9009 • 
Z UUZ , 


PR 
JT r\ 




— ATTC- 


9009 • 
Z U UZ / 


PR 


X o 




9009 • 

Z U UZ j 


PR 

XT X\ 


9fi 




9009 • 


PR 
Jri\ 


96 
z o 


— ATTC- 


9009 • 

Z U UZ / 


PR 
JT r\ 


97 
z / 


- ATTH- 


9009 • 


PR 
JrK 


1 9 
XZ 


o JLJT 


9009 • 
Z U UZ / 


PR 

Jrrv 


90 
z u 




9009 • 

Z. W U Z. f 


PR 
xr r\ 


9^ 


_ c pp_ 
o xZiir 


9009 • 

Z. U KJC. i 


PR 


*^o 
o u 


— e FP— 


9009 • 
z u uz r 


PR 

XT X\ 




O HiX: 


9009 • 


PR 
xr r\ 


"30 


_CT?P- 

o Hi n 


9009 • 


PR 

JrK 


^o 




9009 • 
Z U U Z r 


PR 


09 


-OCT- 


2002; 


PR 


09 


-OCT- 


2002; 


PR 


23 


-OCT- 


2002; 


PR 


28 


-OCT- 


2002; 


PR 


31 


-OCT- 


2002; 



2002US-0387400P. 
2002US-0387535P. 
2002US-0387610P. 
2002US-0387625P. 
2002US-0387634P. 
2002US-0387668P. 
2002US-0387696P. 
2002US-0387702P. 
2002US-0387836P. 
2002US-0387859P. 
2002US-0387933P. 
2002US-0387934P. 
2002US-0387960P. 
2002US-0388022P. 
2002US-0388096P. 
2002US-0389123P. 
2002US-0389118P. 
2002US-0389120P. 
2002US-0389144P. 
2002US-0389146P. 
2002US-0389729P. 
2002US-0389742P. 
2002US-0389884P. 
2002US-0390006P. 
2002US-0390209P. 
2002US-0390763P. 
2002US-0396706P. 
2002US-0401628P. 
2002US-0402156P. 
2002US-0402256P. 
2002US-0402389P. 
2002US-0402786P. 
2002US-0402816P. 
2002US-0402821P. 
2002US-0402832P. 
2002US-0403448P. 
2002US-0403459P. 
2002US-0403531P. 
2002US-0403532P. 
2002US-0403563P. 
2002US-0406317P. 
2002US-0403617P. 
2002US-0406182P. 
2002US-0406355P. 
2002US-0406240P. 
2002US-0410084P. 
2002US-0412528P. 
2002US-0412731P. 
2002US-0414801P. 
2002US-0414839P. 
2002US-0414840P. 
2002US-0414954P. 
2002US-0417186P. 
2002US-0417406P. 
2002US-0420639P. 
2002US-0421156P. 
2002US-0422690P. 



PR 01-NOV-2002; 2002US-0423130P . 

PR 05-NOV-2002; 2002US-00423798 . 

PR 05-NOV-2002; 2002US-0423798P . 

PR 12-NOV-2002; 2002US-0425453P . 
XX 

PA (CURA-) CURAGEN CORP. 
XX 

PI Alsobrook JP, Alvarez E, Anderson DW, Boldog FL, Casman SJ; 

PI Catterton E, Chapoval A, Crabtree-Bokor JR, Edinger SR, Ellerman K; 

PI Ettenberg S, Gangolli EA, Gerlach VL, Gorman L, Gunther E, Guo X; 

PI Gusev VY, Herrmann JL, Ji W, Kekuda R, Li L, Liu X, Macdougall JR; 

PI Maclachlan T, Malyankar UM, Mezick AJ, Millet I, Mishra VS; 

PI Padigaru M, Patturajan M, Pena CEA, Peyman JA, Raha D, Rastelli L; 

PI Rieger DK, Rothenberg ME, Sciore P, Shenoy SG, Shimkets RA; 

PI Smithson G, Spytek KA, Stone DJ, Vernet CAM, Voss EZ, Zhong M; 

PI Zhong H; 

XX 

DR WPI; 2004-081935/08. 

DR P-PSDB; ADH71632. 
XX 

PT New NOVX polypeptides and nucleic acid molecules useful for preventing or 

PT treating NOVX-associated disorders, e.g. cancer, diabetes, infection or 

PT obesity, and in chromosome mapping, tissue typing or pharmacogenomics. 
XX 

PS Example 21; SEQ ID NO 527; 1880pp; English. 
XX 

CC The invention relates to a novel isolated polypeptide (NOVX) . A 

CC polypeptide of the invention has cytostatic, immunomodulator, 

CC neuroprotective, nootropic, anorectic, antidiabetic, antimicrobial, and 

CC antilipaemic activity, and may have a use in gene therapy, and as a 

CC vaccine. The polypeptides are encoded by NOVX polynucleotides comprising 

CC any of the 303 fully defined nucleotide sequences given in the 

CC specification. The polypeptide is useful in the manufacture of a 

CC medicament for treating a syndrome associated with a human disease. The 

CC polypeptide, polynucleotide and antibody are useful in diagnosing, 

CC treating or preventing NOVX-associated disorders, e.g. cancer, cachexia, 

CC Alzheimer's disease, Parkinson's disease, obesity, diabetes, infectious 

CC diseases, metabolic syndrome X or dyslipidaemias . The nucleic acids are 

CC further used as hybridisation probes, in chromosome mapping, tissue 

CC typing, preventive medicine, and pharmacogenomics. The present sequence 

CC encodes a NOVX polypeptide of the invention. 

XX 

SQ Sequence 2881 BP; 526 A; 984 C; 868 G; 503 T; 0 U; 0 Other; 

Query Match 97.1%; Score 2619.8; DB 12; Length 2881; 
Best Local Similarity 98.9%; Pred. No. 0; 

Matches 2672; Conservative 0; Mismatches 22; Indels 9; • Gaps 3; 

Qy 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 87 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 146 

Qy 61 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 147 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 206 



Qy 



121 GACCT GCT T C CC CACTT CCT GGT GGAGCC CGAGGAT GT GT ACAT C GT CAAGAACAAGC CA 180 



1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 II 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 

Db 207 GACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATGTGTACATCGTCAAGAACAAGCCA 266 

Qy 181 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 267 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 326 

Qy 241 TGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGGCTGCCC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 327 TGGGT GCGC CAGGT GGACCAC GT GAT C GAGC GC AGC ACAGAC GGGAGCAGT GGT GAGC C G 386 

Qy 301 ACCATGGAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAG 360 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 387 ACCATGGAGGT C CGCAT TAAT GT CT CAAGGCAGC AG GTCGAGAAGGTGTT CGGGCT GGAG 446 

Qy 361 GAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCC 420 

I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 447 GAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCC 506 

Qy 421 TACATCCGCATAGCCAGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTG 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 507 TACAT CCGC AT AGCC AGATT GC GCAAGAACTTCGAGC AGGAGCC GCTGGC CAAGGAGGT G 566 

Qy 481 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 567 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 626 

Qy 541 GTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATC 600 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I 
Db 627 GT GGAGTGGCTCC GGAACGAGGAC CT GGT GGACC CGT CCCTGGAC C CCAAT GT AT AC AT C 686 

Qy 601 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 660 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I 
Db 687 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 746 

Qy 661 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 720 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 747 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 806 

Qy 721 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 807 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 866 

Qy 781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 840 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 867 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 926 

Qy 841 TGTGAGGGGCAGAAT GT CCAGAA AACAGCCT GCGCCACCCT GT GCCCAGTAGACGGC 897 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 927 TGTGAGGGGCAGAATGTCCATGACCGCACCGTCTCCTCTCTGCTTGTCTCTGTGGACGGC 986 

Qy 898 AGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGC 957 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 987 AGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGC 104 6 

Qy 958 CGT GAGTGCT CT GAC C C AGCAC C C C GCAAC GGAGGGGAGGAGT GCCAGGGC ACT GACCT G 1017 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy' 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 



1047 CGT GAGT GCT CT GACCCAGCACC C C GGAACGGAGGGGAGGAGT G C CAGGGCACTGACCTG 1106 

1018 GACACC C GCAACT GT AC CAGT GACCT CT GT GT AC AC AGT GCTT CT GGC C CT GAGGAC GT G 1077 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1107 GACAC C CGCAACTGTAC CAGTGAC CT CT GT GT AC ACAGT GCTT CT GGCCCT GAGGAC GT G 1166 

1078 GCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTC 1137 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1167 GCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTC 1226 

1138 ATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATT 1197 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I 

ATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATT 1286 



1257 



1227 



.1198 CT CACCT CAGGCT T C CAGCCCGT C AGCAT CAAGC C C AGCAAAGC AGACAAC C CCC AT CT G 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1287 CT CACCTCAGGCTT C CAGCC CGT C AGCAT CAAGC CCAGCAAAGC AGACAAC CCCC AT CT G 1346 

1258 CTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCC 1317 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1347 CT CACCAT CC AGCCGGAC CT CAG CACCACCACCACCTACCAGGGCAGTCTCTGTCCC 1403 

1318 CGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTG 1377 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1404 CGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTG 1463 

1378 GGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTC 1437 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
1464 GGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTC 1523 

1438 TCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACC 1497 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
TCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACC 1583 



1524 



1498 TATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1584 TATGGGAC CTTCAACTT CCTCGGGGGCC GGCT GAT GAT C CCTAAT ACAGGT ATCAGC CT C 



1558 



1557 



1643 



CT CATCCC CCCAGAT GC CAT AC CCC GAGGGAAGAT CT AT GAGAT CT ACCT CACGCT GCAC 1617 

I I I III I I I III MM II II I I I I I I I I I Ml I I I II I I I I I I I I I I I I I I I I I II I I I 

1644 CT CATCCC C C CAGAT GT CAT AC C C CGAGGGAAGAT CT AT GAGAT CT ACCT C AC GCT GCAC 1703 

1618 AAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTT 1677 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1704 AAGC CGGAAGAC GT GAGGTTGC C C CT AGCT GGCT GT CAGAC C CT GCT GAGT CCCAT CGTT 1763 

1678- AGCT GTGGACCCCCTGGCGTCCTGCTCACCCGGC CAGT CAT CCTGGCTATGGACCACTGT 1737 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1764 AGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGT 1823 

1738 GGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGC 1797 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1824 GGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGC 1883 

1 7 98 TGGG AGGAT GT GCT GC ACCT GGGC GAGGAGGC GC CCT C C CAC CT CT ACT ACT GC CAG 1854 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

1884 T GGGAGCAGGAT GT GCT GCACCT GGGC GAGGAGGCGC CCT C C CACCT CT ACT ACT GC CAG 1943 



Qy 1855 CTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGA 1914 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 1944 CTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGA 2003 

Qy 1915 GAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCC 1974 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2004 GAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCC • 2063 

Qy 1975 TGC ACCT CC CT C GAGT ACAACAT C C GGGTCT ACT GCCT GC AT GAC ACC C AC GAT GCACT C 2034 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2064 TGC ACCT CC CT C GAGT ACAACAT CC GGGTCT ACT GCCT GCAT GACACC C AC GAT GCACT C 2123 

Qy 2035 AAGGAGGTGGT GCAGCT GGAGAAGCAGCTGGGGGGAC AG CT GAT CC AGGAGCCACGGGT C 2094 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2124 AAGGAGGTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTC 2183 

Qy 2095 CT GCACTTCAAGGAC AGTTAC CACAACCTGC GCCT AT C CAT C CAC GAT GT GC C C AGCT C C 2154 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2184 CT GCACTTCAAGGACAGTTAC CACAACCTGC GCCT AT C CAT CC AC GAT GT GC C C AGCT C C 2243 

Qy 2155 CT GT GGAAGAGTAAGCT CCTT GT CAGCT ACCAGGAGAT CC CCTTTT AT CAC AT CT GGAAT 2214 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I 
Db 2244 CT GTGGAAGAGT AAGCTCCTTGT CAGCT AC CAGGAGAT CCCCTTTTAT CACAT CT GGAAT 2303 

Qy 2215 GGCACGCAGCGGTACTT GCACT GCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGT 2274 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 2304 GGCACGCAGCGGT ACTTGC ACT GCACCTTC AC C CT GGAGC GT GT CAGC C C CAGCACT AGT 2363 

Qy 2275 GACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATC 2334 

I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2364 GACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATC 2423 

Qy 2335 AACTTCAACATCACCAAGGACACAAGGTTT GCT GAGCTGCT GGCTCTGGAGAGTGAAGCG 2394 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2424 AACT T CAACAT CACCAAGGAC ACAAGGTTT GCT GAGCT GCT GGCT CTGGAGAGTGAAGC G 24 83 

Qy 2395 GGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAG 2454 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2484 GGGGT CC CAGC CCT GGT GGGC CCC AGT GCCT T CAAGAT CCCCTT CCTCATT CGGCAGAAG 2543 

Qy 2455 ATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAG 2514 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2544 ATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAG 2603 

Qy 2515 AAACT C CAC CT GGACAGCCAT CT CAGCTT CT TTGC CT C CAAGCC CAGC CCCACAGC CAT G 2574 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 2604 AAACT C CAC CT GGACAGC CAT CT CAGCTT CT T T GC CT C CAAGCC CAGC CCCACAGC CAT G 2663 

Qy 2575 ATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCA 2634 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2664 ATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCA 2723 

Qy 2635 GCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGC 2694 

II I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 2724 GCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGC 2783 



Qy 

Db 



2695 TGA 2697 
I I I 

2784 TGA 2786 
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DR P-PSDB; ADH71646. 
XX 

PT New NOVX polypeptides and nucleic acid molecules useful for preventing or 

PT treating NOVX-associated disorders, e.g. cancer, diabetes, infection or 

PT obesity, and in chromosome mapping, tissue typing or pharmacogenomics . 
XX 

PS Example 21; SEQ ID NO 541; 1880pp; English. 
XX 

CC The invention relates to a novel isolated polypeptide (NOVX) . A 

CC polypeptide of the invention has cytostatic, immunomodulator, 

CC neuroprotective, nootropic, anorectic, antidiabetic, antimicrobial, and 

CC antilipaemic activity, and may have a use in gene therapy, and as a 

CC vaccine. The polypeptides are encoded by NOVX polynucleotides comprising 

CC any of the 303 fully defined nucleotide sequences given in the 

CC specification. The polypeptide is useful in the manufacture of a 

CC medicament for treating a syndrome associated with a human disease. The 

CC polypeptide, polynucleotide and antibody are useful in diagnosing, 

CC treating or preventing NOVX-associated disorders, e.g. cancer, cachexia, 

CC Alzheimer f s disease, Parkinson's disease, obesity, diabetes, infectious 

CC diseases, metabolic syndrome X or dyslipidaemias . The nucleic acids are 

CC further used as hybridisation probes, in chromosome mapping, tissue 

CC typing, preventive medicine, and pharmacogenomics. The present sequence 

CC encodes a NOVX polypeptide of the invention. 

XX 

SQ Sequence 2881 BP; 526 A; 986 C; 868 G; 501 T; 0 U; 0 Other; N 

Query Match 97.1%; Score 2619.8; DB 12; Length 2881; 

Best Local Similarity 98.9%; Pred. No. 0; 

Matches 2672; Conservative 0; Mismatches 22; Indels 9; Gaps 3; 

ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 146 

CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 120 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 206 

GACCT GCTTCC CCACTT CCT GGTGGAGC C CGAGGAT GT GT ACAT CGT CAAGAACAAGCCA 180 
I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAC CT GCTT CCC CACTT C CT GGT GGAGC CCGAGGAT GT GT ACAT C GT CAAGAACAAGCCA 266 

GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 240 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 32 6 

TGGGT GC GC C AGGT GGAC CAC GT GAT CGAGC GCAGC AC AGAC GGGAGCAGT GGGCT GCCC 300 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
T GGGT GC GC CAGGT GGAC CAC GT GAT C GAGC GCAGCACAGAC GGGAGCAGT GGTGAGCC G 386 



Qy 


1 


Db 


87 


Qy 


61 


Db 


147 


Qy 


121 


Db 


207 


Qy 


181 


Db 


267 


Qy 


241 


Db 


327 



Qy 



301 



ACCATGGAGGTCCGCATTAATGTCT CAAGGCAGCAGGT CGAGAAGGTGTT CGGGCTGGAG 
I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 



360 



387 AC CAT GGAGGT CC GCATTAAT GT CT CAAGGCAGC AGGT CGAGAAGGT GTT C GGGCT GGAG 446 

361 GAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

447 GAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCC 506 

421 T ACAT CCGC AT AGC CAGATT GC GCAAGAACT TCGAGCAGGAGCC GCT GGCCAAGGAGGT G 480 

1 1 1 1 1 1 1 I 1 1 I I I I 1 1 1 I 1 1 I I I I I I I I 1 1 I 1 1 I I I I I I I 1 1 li I I I I I 1 1 I I I 1 1 I I I I 

507 TACATCCGCAT AGC CAGATT GCGCAAGAACTTCGAGCAGGAGCCGCT GGCCAAGGAGGT G 566 

481 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 540 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

567 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 626 

541 GT GGAGT GGCT C C GGAACGAGGACCT GGT GGACC CGT C C CT GGACC C CAAT GT AT ACAT C 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I I I 

627 GTGGAGT GGCT C C GGAACGAGGAC CT GGT GGACC C GT C C CT GGACC C CAAT GT AT AC AT C 686 

601 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

687 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 746 

661 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 720 

II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

747 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 806 

721 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 780 

I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

807 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 866 

781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 840 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

867 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 926 

841 T GT GAGGGGC AGAAT GT CCAGAA AACAGCCTGCGCCACCCTGTGCCCAGTAGACGGC 897 

I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I II I I I I I I I I I I 

927 TGTGAGGGGCAGAATGTCCATGACCGCACCGTCTCCTCTCTGCTTGTCTCTGTGGACGGC 986 

898 AGCTGGAGCCCGTGGAGCAAGT GGT CGGCCTGT GGGCT GGACTGCACCCACTGGCGGAGC 957 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

987 AGCTGGAGCCCGTGGAGCAAGT GGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGC 104 6 

958 C GTGAGT GCT CT GACCCAGCAC CC C GCAAC GGAGGGGAGGAGT GC CAGGGCACT GAC CT G 1017 

1 I I II I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1047 C GT GAGT GCT CT GACCCAGCAC CC C GCAAC GGAGGGGAGGAGT GCCAGGGCACT GAC CT G 1106 

1018 GACAC CC GCAACTGT ACCAGT GAC CT CT GT GT AC ACAGT GCTT CT GGC C CT GAGGAC GT G 1077 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1107 GAC AC CCGCAACT GT ACCAGT GAC CTCT GT GT AC ACAGT GCTT CT GGC C CT GAGGAC GT G 1166 

1078 GCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTC 1137 

I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1167 GCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTC 1226 

1138 ATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATT 1197 

I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1227 AT CCT CGTTT AT T GC CGGAAGAAGGAGGGGCT GGACT CAGAT GT GGCT GACTC GTC C ATT 1286 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1198 CT C ACCT C AGGCTT CCAGC C CGT CAGCAT CAAGC CCAGCAAAGC AGACAAC C CCCAT CTG 1257 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1287 CT CAC CT CAGGCTT C CAGC C CGT CAGCATCAAGCC CAGCAAAGC AGACAAC C CC C AT CT G 1346 

1258 CTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCC 1317 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1347 CT CAC CAT C C AG C C G GAC C T C AG CACCACCACCACCTACCAGGGCAGTCTCTGTCCC 1403 

1318 CGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTG 1377 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1404 CGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTG 1463 

1378 GGT GGCGGCCGCCACACACT GCAC CACAGCT CT C C C AC CT CT GAGGC CGAGGAGTT C GTC 1437 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1464 GGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTC 1523 

1438 TCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACC 1497 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1524 TCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACC 1583 

1498 TATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTC 1557 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1584 TATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTC 1643 



1558 CT CATCCCCCCAGATGCCATACCCCGAGGGAAGAT CTAT GAGAT CT ACCTCACGCTGCAC 1617 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
1644 CT CATCCC C CCAGAT GCCAT ACCC C GAGGGAAGAT CTAT GAGAT CT ACCT CACGCT GCAC 17 03 

1618 AAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTT 1677 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1704 AAGC CGGAAGAC GT GAGGT T GC CC CT AGCT GGCT GT CAGAC C CT GCT GAGT CCCAT C GTT 1763 

1678 AGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGT 1737 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1764 AGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGT 1823 

1738 GGGGAGC C CAGC CCTGACAGCT GGAGCCT GC GC CT CAAAAAGCAGT CGT GC GAGGGC AGC 1797 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1824 GGGGAGC CCAGC CCT GACAGCT GGAGCCT GCGC CT CAAAAAGCAGT CGT GC GAGGGC AGC 1883 

1798 TGGG AGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAG 1854 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I II I I I I II I I 
1884 T GGGAGCAGGAT GT GCT GCACCT GGGCGAGGAGGC GC CCT CC CAC CT CT ACT ACT GC CAG 1943 

1855 CTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGA 1914 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1944 CTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGA 2003 

1915 GAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCC 1974 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2004 GAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCC 



2063 



1975 



T GCACCT C CCT C GAGTACAACAT CCGGGT CT ACT GC CT GCAT GACAC CC AC GAT GC ACT C 2034 
1111111111111111111111 III I I I I I I I I I I I I I I I I I I I I I I I I I II M I I I I I I 
2064 T GCACCT C CCT C GAGTACAACAT C C GGGTCT ACT GCCT GCAT GACAC CC AC GAT GCACT C 2123 



Qy 2035 AAGGAGGT GGT GCAGCT GGAGAAGCAGCT GGGGGGACAGCT GAT C C AGGAGC CACGGGTC 2094 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 2124 AAGGAGGT GGT GCAGCT GGAGAAGCAGCT GGGGGGACAGCT GAT C CAGGAGCCAC GGGT C 2183 

Qy 2095 CT GCACTT CAAGGACAGTT ACC ACAACCT GC GC CT AT C CAT C C AC GAT GT GC CC AG CT C C 2154 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2184 CT GCACTT CAAGGACAGTT AC CACAAC CT GCGC CT AT C CAT C CAC GAT GT GC CCAGCT CC 2243 

Qy 2155 CT GT GGAAGAGTAAGCT C CTT GT CAGCT ACC AGGAGAT CC C CTTT T ATC ACATCT GGAAT 2214 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 2244 CT GT GGAAGAGTAAGCT CCTTGT CAGCT AC C AGGAGAT C C C CTT TT ATC AC AT CT GGAAT 2303 

Qy 2215 GGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGT 2274 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2304 GGCACGCAGC GGT ACTT GC ACCGC AC CT T CACC CT GGAGCGT GT CAGCCCCAGCACT AGT 2363 

Qy 2275 GACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATC 2334 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2364 GACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATC 2423 

Qy 2335 AACT TCAACAT CAC CAAGGACACAAGGTTT GCT GAGCT GCT GGCT CT GGAGAGT GAAGCG 2394 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2424 AACTTCAACATCAC CAAGGACACAAGGTTT GCT GAGCT GCT GGCT CTGGAGAGT GAAGCG 2483 

Qy 2395 GGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAG 2454 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 2484 GGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAG 2543 

Qy 2455 ATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAG 2514 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2544 ATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAG 2603 

Qy 2515 AAACTCCACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATG 2574 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2604 AAACTC C ACCT GGACAGC CAT CT CAGCT T CTTT GCCT CCAAGCC CAGCCC CACAGC CAT G 2663 

Qy 2575 ATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCA 2634 

' I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2664 ATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCA 2723 

Qy 2635 GCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGC 2694 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2724 GCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGC 2783 

Qy 2695 TGA 2697 

I I I 

Db 2784 TGA 2786 



RESULT 14 
ADH71627 

ID ADH71627 standard; DNA; 2881 BP. 
XX 

AC ADH71627; 
XX 

DT 25-MAR-2004 (first entry) 
XX 



s 



DE Human gene of the invention N0V21j SEQ ID NO: 523. 
XX 

KW ds; gene; human; cytostatic; immunomodulator ; neuroprotective; nootropic; 

KW anorectic; antidiabetic; antimicrobial; antilipaemic; gene therapy; 

KW vaccine; cancer; cachexia; Alzheimer's disease; Parkinson's disease; 

KW obesity; diabetes; infectious disease; metabolic syndrome X; 

KW dyslipidaemia. 

XX 

OS Homo sapiens. 
XX 

PN WO2003102155-A2. 
XX 

PD ll-DEC-2003. 
XX 

PF 03-JUN-2003; 2003WO-US017430 . 
XX 

PR 03-JUN-2002; 2002US-0385120P. 

PR 04-JUN-2002; 2002US-0385784P . 

PR 05-JUN-2002; 2002US-0386041P. 
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PR 07-JUN-2002; 2002US-0387262P . 

PR 08-JUN-2002; 2002US-0296960P . 
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XX 

PA (CURA-) CURAGEN CORP. 
XX 

PI Alsobrook JP, Alvarez E, Anderson DW, Boldog FL, Casman SJ; 

PI Catterton E, Chapoval A, Crabtree-Bokor JR, Edinger SR, Ellerman K; 

PI Ettenberg S, Gangolli EA, Gerlach VL, Gorman L f Gunther E f Guo X; 

PI Gusev VY, Herrmann JL, Ji W, Kekuda R, Li L, Liu X, Macdougall JR; 

PI Maclachlan Malyankar UM, Mezick AJ, Millet I, Mishra VS; 

PI Padigaru M, Patturajan M, Pena CEA, Peyman JA, Raha D, Rastelli L; 

PI Rieger DK, Rothenberg ME, Sciore P, Shenoy SG, Shimkets RA; 

PI Smithson G, Spytek KA f Stone DJ, Vernet CAM f Voss EZ, Zhong M; 

PI Zhong H; 

XX 

DR WPI; 2004-081935/08. 

DR P-PSDB; ADH71628. 
XX 

PT New NOVX polypeptides and nucleic acid molecules useful for preventing or 

PT treating NOVX-associated disorders, e.g. cancer, diabetes, infection or 

PT obesity, and in chromosome mapping, tissue typing or pharmacogenomics . 
XX 

PS Example 21; SEQ ID NO 523; 1880pp; English. 
XX 



CC The invention relates to a novel isolated polypeptide (NOVX) . A 

CC polypeptide of the invention has cytostatic, immunomodulator, 

CC neuroprotective, nootropic, anorectic, antidiabetic, antimicrobial, and 

CC antilipaemic activity, and may have a use in gene therapy, and as a 

CC vaccine. The polypeptides are encoded by NOVX polynucleotides comprising 

CC any of the 303 fully defined nucleotide sequences given in the 

CC specification. The polypeptide is useful in the manufacture of a 

CC medicament for treating a syndrome associated with a human disease. The 

CC polypeptide, polynucleotide and antibody are useful in diagnosing, 

CC treating or preventing NOVX-associated disorders, e.g. cancer, cachexia, 

CC Alzheimer's disease, Parkinson's disease, obesity, diabetes, infectious 

CC diseases, metabolic syndrome X or dyslipidaemias . The nucleic acids are 

CC further used as hybridisation probes, in chromosome mapping, tissue 

CC typing, preventive medicine, and pharmacogenomics . The present sequence 

CC encodes a NOVX polypeptide of the invention. 

XX 

SQ Sequence 2881 BP; 525 A; 985 C; 869 G; 502 T; 0 U; 0 Other; 



Query Match 97.1%; Score 2619.8; DB 12; Length 2881; 

Best Local Similarity 98.9%; Pred. No. 0; 

Matches 2672; Conservative 0; Mismatches 22; Indels 9; Gaps 3; 



Qy 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 

I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I 
Db 87 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 146 

Qy 61 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 120 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 147 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 206 

Qy 121 GACCT GCTT CCC CACTT C CT GGT GGAGC CCGAGGATGT GTACAT C GT CAAGAACAAGC CA 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 207 GACCT GCTT CCCCACTT C CT GGT GGAGC CCGAGGATGT GTACAT C GT CAAGAACAAGC CA 266 

Qy 181 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 267 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 326 

Qy 241 T GGGT GCGCCAGGT GGAC CACGT GAT C GAGC GCAGCACAGAC GGGAGCAGT GGGCT GC CC 300 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I III 
Db 327 T GGGTGCGC CAGGT GGAC CACGT GAT C GAGCGCAGCACAGACGGGAGCAGT GGTGAGCCG 386 

Qy 301 ACC AT GGAGGT CC GCAT TAAT GT CT CAAGGCAGC AGGT CGAGAAGGT GT T CGGGCT GGAG 360 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 387 AC CAT GGAGGT CCGCATTAATGTCT CAAGGCAGCAGGT CGAGAAGGT GTTCGGGCTGGAG 446 

Qy 361 GAAT ACT GGT GC C AGT GCGT GGCAT GGAGCT C CT CGGGCAC C ACCAAGAGT C AGAAGGC C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 447 GAAT ACT GGT GCC AGT GCGT GGCAT GGAGCT CCT CGGGCAC CACCAAGAGT C AGAAGGC C 506 

Qy 421 TAC AT C CGCATAGC CAGATT GCGCAAGAACTT CGAGCAGGAGCCGCTGGCCAAGGAGGT G 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 507 TAC AT C CGCATAGC CAGATT GCG CAAGAACTT CGAGCAGGAGC CGCT GGCCAAGGAGGT G 566 

Qy 481 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I f I I I I I I I I I I I I I I I 
Db 567 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 626 



541 GTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATC 600 

I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II 

627 GT GGAGT GGCT C CGGAAC GAGGACCT GGT GGACC CGTC C CT GGAC CC CAAT GT AT ACAT C 686 

601 AC GCGGGAGCACAGC CT GGT GGT GC GACAGGCC C GC CT T GCT GAC AC GGC CAACT AC ACC 660 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

687 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 746 

661 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

747 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 806 

721 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 780 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

807 GTGAAC GGT GGGT GGT CGACGT GGAC CGAGT GGT CCGTCTGCAGCGCCAGCTGTGGGCGC 866 

.781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 840 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

867 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 926 

841 T GT GAGGGGCAGAAT GT C CAGAA AACAGCCT GCGCCACC CT GT GCC CAGT AGAC GGC 897 

I I I I I I I M I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

927 T GT GAGGGGCAGAAT GT CCAT GAC C GCAC C GT CT C CT CT CT GCT T GT CT CT GT GGAC GGC 986 

898 AGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGC 957 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

987 AGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGC 104 6 

958 C GT GAGT GCT CT GACCCAGCACCCC GCAAC GGAGGGGAGGAGT GCCAGGGCACT GAC CTG 1017 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

1047 CGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTG 1106 

1018 GAC ACCC GCAACT GT AC CAGT GACCT CT GT GT ACACAGT GCTTCT GGCC CT GAGGAC GT G 1077 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1107 GACACCCGCAACT GT AC CAGT GACCT CT GT GT GCACAGT GCTTCT GGCC CT GAGGAC GT G 1166 

1078 GCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTC 1137 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1167 GCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTC 1226 

1138 ATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATT 1197 

. I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I 

1227 ATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATT 1286 

1198 CT CACCT CAGGCTT C CAGC C CGT CAGCAT CAAGC C C AGCAAAGC AGACAAC CCC CAT CTG 1257 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1287 CT CACCT CAGGCTT C CAGC C CGT CAGCAT CAAGC C C AGCAAAGC AGACAAC CCC CAT CT G 1346 

1258 CTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCC 1317 

I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I II I I I II I I I I I I II I I I I I I I I I I 

1347 CT CACCAT CCAGCC GGACCT C AG CACCACCACCACCTACCAGGGCAGTCTCTGTCCC 1403 

1318 CGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTG 1377 

I I I I I I I I I I II 11111111111 II I II I I I I I I I M I I I II I I M I I I I I I I I I I I I I I 

1404 CGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCAC CAAT GGGCACCT GCT CAGC CCCCTG 1463 



1378 GGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTC 1437 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1464 GGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTC 1523 

1438 TCGCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACC 1497 

I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
1524 TCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACC 1583 

1498 TATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTC 1557 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
1584 TATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTC 1643 

1558 CT C AT CC C CC C AGAT GC CAT ACCCCGAGGGAAGAT CT ATGAGAT CT ACCT CAC GCT GC AC 1617 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1644 CT C AT CCC CC C AGAT GCCAT AC C C CGAGGGAAGAT CT AT GAGAT CT ACCT CACGCT GCAC 1703 

1618 AAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTT 1677 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1704 AAGC C GGAAGACGT GAGGTT GC CC CTAGCT GGCT GT CAGAC CCT GCT GAGT CCCAT C GTT 1763 

1678 AGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGT 1737 

I I I I I I I II II .1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 11 I I I I I I 
1764 AGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGT 1823 

1738 GGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGC 1797 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1824 GGGGAGC CCAGCCCT GACAGCT GGAGCCTGCGC CT CAAAAAGCAGT C GTGC GAGGGCAGC 1883 

1798 TGGG AGGAT GT GCT GCACCT GGGCGAGGAGGC GC C CT C CCAC CT CT ACTACTGCCAG 1854 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1884 T GGGAGCAGGATGT GCT GCACCT GGGCGAGGAGGC GC C CT CCCACCT CT ACTACT GC CAG 1943 

1855 CTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGA 1914 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
1944 CTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGA 2003 

1915 GAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCC 1974 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
2004 GAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCC 2063 

1975 TGCACCTCCCTCGAGTACAACATCCGGGTCTACTGCCTGCATGACACCCACGATGCACTC 2034 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2064 T GCAC CT C C CT CGAGTACAACAT CCGGGTCT ACT GCCT GCATGACACC CACGAT GCACTC 2123 

2035 AAGGAGGT GGT GCAGCT GGAGAAGCAGCTGGGGGGACAGCT GAT C CAGGAGCCACGGGT C 2094 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
2124 AAGGAGGT GGT GCAGCT GGAGAAGCAGCTGGGGGGACAGCTGAT C C AGGAGCCAC GGGT C 2183 

2095 CT GCACT T CAAGGAC AGTT ACC ACAACCT GC GC CT AT C CAT CCAC GAT GT GCCCAGCT CC 2154 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2184 CTGCACTT CAAGGAC AGTTACCACAACCTGC GC CT AT C CAT CCAC GAT GT GCCCAGCT CC 2243 

2155 CT GT GGAAGAGT AAGCT C CT T GT CAGCT ACC AGGAGAT CCC CTTTT AT CACAT CT GGAAT 2214 

I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | II I I I I I I I I I I I I I I I I I I I I I 
2244 CT GT GGAAGAGTAAGCT CCTT GT CAGCT AC CAG GAGAT CC CCTTTT AT CACAT CT GGAAT 2303 

2215 GGC AC GCAGC GGT ACTT GCACT GC AC CTTCACC CT GGAGC GTGT C AGC C C CAGC ACT AGT 2274 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 2304 GGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGT 2363 

Qy 2275 GACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATC 2334 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 2364 GAC CTGGC CT GCAAGCT GT GGGT GT GGC AGGTGGAGGGC GAC GGGCAGAGCTT CAGCAT C 2423 

Qy 2335 AACTTCAACAT CACCAAGGACACAAGGTTTGCTGAGCT GCT GGCTCT GGAGAGTGAAGCG 2394 

I I I I I I I I I I I I I I I I I I I I I I I I I I ! II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 2424 AACTTCAACAT CACCAAGGACACAAGGTTTGCTGAGCT GCTGGCT CT GGAGAGTGAAGCG 2483 

Qy 2395 GGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAG 2454 

I I I I I I I I I I I I I I I I I I I I I I I hi I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2484 GGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAG 2543 

Qy 2455 ATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAG 2514 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2544 ATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAG 2603 

Qy 2515 AAACTCCACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATG 2574 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2604 AAACT C C ACCT GGACAGC CATCT CAGCT T CTTT GC CT C CAAGCCCAGCCC CACAGCCAT G 2663 

Qy 2575 ATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCA 2634 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2664 AT C CTCAACCT GT GGGAGGC GC GGCACT T C C CCAAC GGCAAC CT CAGCCAGCT GGCT GCA 2723 

Qy 2635 GCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGC 2694 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I 1 1 1 1 1 1 1 I ! I 1 1 1 1 1 1 1 

Db 2724 GCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGC 2783 

Qy 2695 TGA 2697 

I I I 

Db 2784 TGA 2786 
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XX 
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XX 

PA (CURA-) CURAGEN CORP. 
XX 

PI Alsobrook JP, Alvarez E, Anderson DW, Boldog FL, Casman SJ; 

PI Catterton E, Chapoval A, Crabtree-Bokor JR, Edinger SR, Ellerman K; 

PI Ettenberg S, Gangolli EA, Gerlach VL, Gorman L, Gunther E, Guo X; 

PI Gusev VY, Herrmann JL, Ji W, Kekuda R, Li L, Liu X, Macdougall JR; 

PI Maclachlan T, Malyankar UM, Mezick AJ, Millet 1, Mishra VS; 

PI Padigaru M, Patturajan M, Pena CEA f Peyman JA f Raha D, Rastelli L; 

PI Rieger DK, Rothenberg ME, Sciore P, Shenoy SG, Shimkets RA; 

PI Smi.thson G, Spytek KA, Stone DJ, Vernet CAM, Voss EZ, Zhong M; 

PI Zhong H; 

XX 

DR WPI; 2004-081935/08. 

DR P-PSDB; ADH71640. 
XX 

PT New NOVX polypeptides and nucleic acid molecules useful for preventing or 

PT treating NOVX-associated disorders, e.g. cancer, diabetes, infection or 

PT obesity, and in chromosome mapping, tissue typing or pharmacogenomics . 
XX 

PS Example 21; SEQ ID NO 535; 1880pp; English. 
XX 

CC The invention relates to a novel isolated polypeptide (NOVX) . A 

CC polypeptide of the invention has cytostatic, immunomodulator, 

CC neuroprotective, nootropic, anorectic, antidiabetic, antimicrobial, and 

CC antilipaemic activity, and may have a use in gene therapy, and as a 

CC vaccine. The polypeptides are encoded by NOVX polynucleotides comprising 

CC any of the 303 fully defined nucleotide sequences given in the 

CC specification. The polypeptide is useful in the manufacture of a 

CC medicament for treating a syndrome associated with a human disease. The 

CC polypeptide, polynucleotide and antibody are useful in diagnosing, 

CC treating or preventing NOVX-associated disorders, e.g. cancer, cachexia, 

CC Alzheimer's disease, Parkinson's disease, obesity, diabetes, infectious 

CC diseases, metabolic syndrome X or dyslipidaemias . The nucleic acids are 

CC further used as hybridisation probes, in chromosome mapping, tissue 



CC typing, preventive medicine, and pharmacogenomics . The present sequence 

CC encodes a NOVX polypeptide of the invention. 

XX 

SQ Sequence 2881 BP; 525 A; 985 C; 869 G; 502 T; 0 U; 0 Other; 

Query Match 97.1%; Score 2619.8; DB 12; Length 2881; 

Best Local Similarity 98.9%; Pred. No. 0; 

Matches 2672; Conservative 0; Mismatches 22; Indels 9; Gaps 3; 

Qy 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 87 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 146 

Qy 61 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 147 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 206 

Qy 121 GACCTGCT T CC C C ACTT CCT GGT GGAGC C CGAGGAT GT GT AC AT CGT CAAGAACAAGCCA 180 

I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 207 GACCT GCTT CCC CACTT CCT GGT GGAGC C C GAGGAT GT GT AC AT CGT CAAGAACAAGCCA 266 

Qy 181 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 267 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 326 

Qy 241 TGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGGCTGCCC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 327 TGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGTGAGCCG 386 

Qy 301 ACCATGGAGGT C CGCATTAATGT CT CAAGGCAGC AGGT C GAGAAGGT GTT CGGGCT GGAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I 
Db 387 ACCATGGAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAG 44 6 

Qy 361 GAAT ACT GGT GCCAGTGCGT GGC AT GGAGCT CCT C GGGCAC CAC CAAGAGT C AGAAGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 447 GAAT ACT GGT GCCAGTGCGT GGCAT GGAGCT CCT C GGGCAC CAC CAAGAGT CAGAAGGCC 506 

Qy 421 TACATCCGCATAGCCAGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTG 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I 

Db 507 TACATCCGCATAGCCAGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTG 566 

Qy 481 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 567 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 626 

Qy 541 GT GGAGT GGCT CC GGAACGAGGACCT GGT GGACC C GTCC CT GGACC C CAAT GT AT AC ATC 600 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 627 GT GGAGT GGCT C C GGAAC GAGGACCT GGT GGAC CC GTCC CT GGACC C CAAT GT AT ACAT C 686 

Qy 601 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 660 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 687 .ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 746 

Qy 661 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 747 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 806 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 



721 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 780 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

807 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 866 

781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 840 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

867 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 926 

841 T GT GAGGGGC AGAAT GT C C AGAA AACAGCCTGCGCCACCCTGTGCCCAGTAGACGGC 897 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

927 TGTGAGGGGCAGAATGTCCATGACCGCACCGTCTCCTCTCTGCTTGTCTCTGTGGACGGC 986 

898 AGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGC 957 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

987 AGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGC 104 6 



958 



CGT GAGTGCT CT GACC CAGCACCC C GCAACGGAGGGGAGGAGT GC CAGGGCACT GACCT G 1017 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1047 CGT GAGTGCTCT GACCCAGCACCC C GCAACGGAGGGGAGGAGT GC CAGGGCACT GAC CT G 1106 

1018 GACAC C CGCAACT GT AC CAGT GAC CT CT GT GTACAC AGT GCTT CT GGC CCT GAGGACGT G 1077 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
1107 GACAC C CGCAACT GT AC CAGT GAC CT CT GT GTACACAGT GCT T CT GGC CCT GAGGACGT G 1166 

1078 GCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTC 1137 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1167 GCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTC 1226 

1138 AT CCT C GTTT AT T GC C GGAAGAAGGAGGGGCTGGACT CAGAT GT GGCT GACT CGT C CAT T 1197 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
ATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATT 



1227 



1286 



1257 



1198 CT CAC CTCAGGCTT C CAGCC C GT C AGCAT CAAGC CCAGCAAAGCAGACAAC C CC C AT CT G 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1287 CT CAC CTCAGGCTTC CAGCC CGT CAGCAT CAAGC CCAGCAAAGCAGACAAC C CC C AT CT G 1346 

1258 CTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCC 1317 

I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1347 CT CACCAT CCAGCC GGAC CT CAG CACCACCACCACCTACCAGGGCAGTCTCTGTCCC 14 03 

1318 CGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTG 1377 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
1404 CGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTG 1463 

1378 GGT GGC GGCCGCCACACACT GCAC CACAGCT CT CCC ACCT CT GAGGCC GAGGAGTT C GT C 1437 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1464 GGT GGC GGC C GC CACAC ACT GCAC CACAG CT CT C C C ACCT CT GAGGC C GAGGAGTT CGT C 1523 

1438 TCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACC 1497 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1524 TCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACC 



1583 



1498 



TATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTC 1557 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

1584 TATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTC 1643 

1558 CT CAT C CCCCCAGAT GC CAT AC C C CGAGGGAAGAT CT AT GAGAT CT AC CT CAC GCT GCAC 1617 



Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

1644 CTCATC CCCCCAGAT GC CATAC CC CGAGGGAAGAT CTAT GAGAT CT ACCT CAC GCT GCAC 1703 

1618 AAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTT 1677 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1704 AAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTT 1763 

1678 AGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGT 1737 

I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I II I I I I I I I II 
1764 AGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGT 1823 

1738 GGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGC 1797 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1824 GGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGC 1883 

1798 TGGG AGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAG 1854 

I I I I I II I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II 
18 84 T GGGAGCAGGATGTGCTGCACCTGGGC GAGGAGGC GC C CT C C CAC CT CTACT ACT GC CAG 



1943 



1855 



CTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGA 1914 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I 
1944 CTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGA 2003 

1915 GAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCC 1974 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2004 GAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAGGCTGCTTCTGTTTGCGCCGGTGGCC 2063 

1975 T GCACCT CCCTC GAGT ACAACAT CC GGGT CT ACTGC CT GCAT GAC AC CCACGAT GC ACT C 2034 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
2064 T GCACCT CCCTC GAGT ACAACAT CC GGGT CT ACTGCCTGCAT GAC AC C CAC GAT GCACT C 2123 

2035 AAGGAGGTGGTGCAGCT GGAGAAGC AGCT GGGGGGACAGCT GAT C CAGGAGC CAC GGGT C 2094 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2124 AAGGAGGTGGTGCAGCTGGAGAAGCAGCT GGGGGGACAGCT GAT CCAGGAGC CAC GGGT C 2183 

2095 CT GC ACTTCAAGGACAGTT ACCACAACCT GCGC CTAT CCAT CCACGAT GT GCCCAGCT C C 2154 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2184 CT GCACTTCAAGGACAGTT ACCACAACCT GCGC CTATCCAT CCACGAT GT GC CCAGCT C C 2243 



2155 



2244 



2215 



CTGT GGAAGAGTAAGCTC CTT GTCAGCT ACCAGGAGAT CCCCTTTTAT CACAT CT GGAAT 2214 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CT GT GGAAGAGTAAGCT C CTT GT CAGCT AC CAGGAGAT CCCCTT T TAT CACAT CT GGAAT 2303 



GGCACGCAGC GGT ACTT GCACT GCACCTT C AC CCT GGAGCGT GT CAGC CC C AGCACT AGT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I U I 

2304 GGCACGCAGC GGT ACTT GCACT GCACCTT CAC CCT GGAGCGT GT C AGC CC CAGCACT AGT 



2275 



2364 



2335 



2424 



GACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
GACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATC 



2274 



2363 



2334 



2423 



2394 



AACTTCAACATCACCAAGGACACAAGGTTT GCT GAGCT GCT GGCT CT GGAGAGT GAAGC G 
I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I II I 
AACTTCAAC ATC AC CAAGGAC ACAAGGTTT GCT GAGCT GCT GGCT CT GGAGAGT GAAGC G 2483 



2395 GGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



2454 



Db 2484 GGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAG 2543 

Qy 2455 ATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAg ' 2514 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 2544 ATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAG 2603 

Qy 2515 AAACTC CAC CTGGAC AGCCAT CT CAGCT TCTTTGCCTC CAAGCC CAGCCCCAC AGCC AT G 2574 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 r 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii 1 1 1 1 1 1 1 1 1 1 1 

Db 2604 AAACT C CAC CT GGAC AGC CATCT CAGCT T CT TT GC CT CCAAGC C CAGCC C CACAGCCAT G 2663 

Qy 2575 ATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCA 2634 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 
Db 2664 ATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCA 2723 

i 

Qy 2635 GCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGC 2694 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2724 GCAGTGGCT GGACTGGGCCAGCCAGACGCT GGCCT CTTCACAGT GT CGGAGGCTGAGT GC 2783 

Qy 2695 TGA 2697 

I I I 

Db 2784 TGA 2786 



Search completed: March 5, 2005, 22:58:58 
Job time : 1381 sees 



GenCore. version 5.1.6 
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OM nucleic - nucleic search, using sw model 



Run on: 



Title: 

Perfect score: 
Sequence: 

Scoring table: 



March 5, 2005, 19:26:23 ; Search time 424.67 Seconds 

(without alignments) 
10391.692 Million cell updates/sec 

US-10-624-932-l_COPY_46_2742 
2697 

1 atggccgtccggcccggcct tgtcggaggctgagtgctga 2697 

IDENTITY_NUC 

Gapop 10.0 , Gapext 1.0 



2405568 



Searched: 1202784 seqs, 818138359 residues 

Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 

Database : Issued_Patents_NA: * 

1 : /cgn2_6/ptodata/l/ina/5A_COMB. seq: * 

2 : /cgn2_6/ptodata/l/ina/5B_COMB. seq: * 

3 : /cgn2_6/ptodata/l/ina/6A_COMB. seq: * 

4 : /cgn2_6/ptodata/l/ina/6B_COMB. seq: * 

5: /cgn2_6/ptodata/l/ina/PCTUS_COMB.seq:* 

6: / cgn2__6/ptodata/l/ina/backf ilesl . seq: * 

Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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RESULT 1 
US-08-808-982-1 

Sequence 1, Application US/08808982 
Patent No. 5939271 
GENERAL INFORMATION: 

APPLICANT: Tessier-Lavigne, Marc 
APPLICANT: Leonardo, E. David 
APPLICANT: Hink, Lindsay 
APPLICANT: Masu, Masayuki 
APPLICANT: Kazuko, Keino-Masu 
TITLE OF INVENTION: Netrin Receptors 
NUMBER OF SEQUENCES: 8 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: SCIENCE & TECHNOLOGY LAW GROUP 
STREET: 268 BUSH STREET, SUITE 3200 
CITY: SAN FRANCISCO 
STATE: CALIFORNIA 
COUNTRY: USA 



ZIP: 94104 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 
; COMPUTER: IBM PC compatible 

OPERATING SYSTEM: PC-DOS/MS-DOS 
; SOFTWARE: Patentln Release #1.0, Version #1.30 

CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/808,982 

FILING DATE: 

CLASSIFICATION: 530 
ATTORNEY/AGENT INFORMATION: 

NAME: OSMAN, RICHARD A 

REGISTRATION NUMBER: 36,627 

REFERENCE/ DOCKET NUMBER: UC96-217 
TELECOMMUNICATION INFORMATION: 

TELEPHONE: (415) 343-4341 

TELEFAX: (415) 343-4342 
; INFORMATION FOR SEQ ID NO: 1: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 3014 base pairs 
; TYPE: nucleic acid 

STRANDEDNESS: double 

TOPOLOGY: linear 
; MOLECULE TYPE: cDNA 
US-08-808-982-1 

Query Match 83.5%; Score 2252.2; DB 2; Length 3014; 

Best Local Similarity 89.7%; Pred. No. 0; 

Matches 2419; Conservative 0; Mismatches 278; Indels 0; Gaps 0; 
Qy 1 
Db 1 
Qy 61 
Db 61 
Qy 121 
Db 121 
Qy 181 
Db 181 
Qy 241 
Db 241 
Qy 301 
Db 301 
Qy 361 
Db 361 



ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I II I I I II I I I I I I I I I I I I I I I I 
ATGGCCGTCCGGCCCGGCCTGTGGCCAGTGCTCCTGGGCATAGTCCTCGCCGCCTGGCTT 60 

CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 120 

II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CGTGGTTCGGGTGCCCAGCAGAGTGCCACGGTGGCCAATCCAGTGCCCGGTGCCAACCCC 120 

GAC CT GCT T CCC C ACTT C CT GGT GGAGC CC GAGGAT GT GT ACAT CGT CAAGAACAAGCCA 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II M I I I I I I I I I I I I I I 

GACCT GCT GCCC CACT T C CT GGT AGAGC CTGAGGACGT GT ACAT TGT CAAGAACAAGCCG 180 

GT GCT GCTT GT GT GCAAGGC C GT GC CC GC CACGCAGATCT TCTT CAAGTGCAAC GGGGAG 240 

III II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GTGTTGTTGGTGTGCAAGGCTGTGCCTGCCACCCAGATCTTCTTCAAGTGCAATGGGGAA 24 0 

T GGGT GCGCCAGGTGGACCACGT GATCGAGCGCAGCACAGACGGGAGCAGT GGGCT GCCC 300 
I I I I I I I I I I I I I II I I I I I II II I I I I I I I I III I I I I I I II I I I I 

T GGGT C CGCCAGGT C GAT CAC GT AATT GAAC GC AGCACC GAC AGCAGCAGC GGATT GC CA 300 

AC C AT GGAGGT C C GC AT T AAT GT CT CAAGGCAGCAGGT C GAGAAGGT GTT C GGGCTGGAG 360 
I I I I I I I I I I I I I I II II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AC CAT GGAGGT C C GT AT CAACGT AT CGAGGCAGC AGGT AGAGAAAGT GTT T GGGCTGGAG 360 

GAAT ACTGGT GC C AGT GC GT GGCAT GGAGCT CCT C GGGCACCAC CAAGAGT CAGAAGGC C 420 
I Mill II III II I I I I II II III III I II M II III I II I II II II I II III I III 

GAAT ACTGGT GC C AGT GT GT GGCAT GGAGCT C CT C GGGT AC CAC CAAAAGT CAGAAGGC C 420 



Qy 421 TAC AT C CGCAT AGCC AGATT GCGCAAGAACTTC GAGC AGGAGC CGCTGGCCAAGGAGGT G 480 

I M I M I I II III I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I III 

Db 421 TAC ATC CGGATT GC CT ATTT GCGCAAGAACTTT GAGCAGGAGCCACT GGCCAAGGAAGTG 480 

Qy 481 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 540 

II I I I I I I I I Mill II II II II II II II II II Mill II I II III 

Db 481 TCACTGGAGCAAGGCATTGTACTACCTTGTCGCCCCCCAGAAGGAATCCCCCCAGCTGAG 540 

Qy 541 GT GGAGTGGCT C CGGAACGAGGAC CT GGTGGAC CCGT CCCT GGACCCCAAT GTAT ACAT C 600 

I I I II II II II II II II II I I II I II II I II I I II I II II II II I I MUM 

Db 541 GTGGAGTGGCTTCGAAATGAGGACCTCGTGGACCCCTCCCTCGATCCCAATGTGTACATC 600 

Qy 601 AC GCGGGAGCACAGC CT GGT GGT GC GACAGGCCC GCCTT GCT GACACGGC CAACT ACACC 660 

II I I II I II II II II M II II II I I I I II I M II I II II I II I I I II I II I I II I 

Db 601 ACGCGGGAGCACAGCCTAGTCGTGCGTCAGGCCCGCCTGGCCGACACGGCCAACTACACC 660 

Qy 661 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 720 

II I I II I II I II II I II I I II II II II M III II I I II II Mill II II 
Db 661 TGT GT GGC CAAGAACAT CGTAGC C CGT C GC C GAAGC ACCT CT GCAGCGGT CATTGTTT AT 720 

Qy 721 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 780 

I II II II II I I II II I I I II II II M M I II II II M I I II I I II I I I II I I I II II I 
Db 721 GTGAACGGTGGGTGGTCGACGTGGACTGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGT 7 80 

Qy 781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 840 

I II I I II II II M II II II I II I I I I II II I I I M II I II II II II II I I II II I III 
Db 7 81 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCACCTCTCAACGGGGGCGCCTTC 840 

Qy 841 TGT GAGGGGC AGAAT GT CC AGAAAACAGCCT GCGCCACCCTGT GCC C AGT AGAC GGCAGC ' 900 

I II II II I I II I II I II I II I II I I I II I II II I I I II II II I I II I II II II III 
Db 841 TGT GAGGGGCAGAAT GT CC AGAAAACAGC CT GCGCC ACT CT GT GC C C AGT GGAT GGGAGC 900 

Qy 901 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 960 

Mill I II I M I II II II II II I II II II II II M II II II I II I II I II I II I 
Db 901 TGGAGTTCGTGGAGTAAGTGGTCAGCCTGTGGGCTTGACTGCACCCACTGGCGGAGCCGC 960 

Qy 961 GAGTGCTCT GAC CCAGCAC CC C GCAACGGAGGGGAGGAGT GCCAGGGCACT GACCT GGAC 1020 

I II II II II I II II I II II II II II I II I II I II II I M I III II II I I II II I 

Db 961 GAGTGCTCTGACCCAGCACCCCGCAATGGAGGTGAGGAGTGTCGGGGTGCTGACCTGGAC 1020 

Qy 1021 ACCCGCAACT GT ACCAGT GAC CT CT GT GTACAC AGT GCT T CT GGC CCT GAGGACGT GGCC 1080 

II I II I II II I II II II I I I I II II I I II II I II II I II II I I I II I II I II 

Db 1021 ACCCGCAACTGTACCAGTGACCTCTGCCTGCACACCGCTTCTTGCCCCGAGGACGTGGCT 1080 

Qy 1081 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1140 

II II I I II II I II I I II II I II II II I II II II I I II I I II I 

Db 1081 CTCTACATCGGCCTTGTCGCTGTGGCTGTGTGCCTCTTCTTGCTGTTGCTGGCCCTTGGA 114 0 

Qy 1141 CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 1200 

III I II I II II II I II II I II II I I I I I II II II II II II I II II I II I III 

Db 1141 CT CAT TT ACTGT CGCAAGAAGGAAGGGCT GGACT CCGAT GT GGCCGACT C GT CCAT CCT C 1200 

Qy 1201 AC CT CAGGCTT C CAGC C C GT C AGCAT CAAGC CC AGCAAAGCAGACAACC C CCAT CT GCT C 1260 

I I II I II II II II I II II II I II II II II I II II I II I II II II II II II I II I II I 
Db 1201 ACCT C GGGCTT C CAGCCT GT C AGCAT CAAGC CC AGCAAAGCAGACAACC C CCACCT GCT C 1260 



